第72章教育数据挖掘_那些投行教会我的爱情

许是前一天下午睡觉摸鱼被周诗亦逮个正着，李洛今天一上午都在亦舟上蹿下跳，抓人开会请教技术问题。林语一直温温柔柔地回答着，让李洛很是满意。

李洛顺着笔记问道：“我不太理解的是，教育数据挖掘（Educational Data Mining，EDM）和学习分析技术（Learning Analytics，LA）的主要区别在什么地方呢？两者不都是利用学习过程中产生的大量数据来分析反馈学习成果吗？”

李洛和涂世欣正挤在林语的卡座旁，各自抱着电脑做着会议记录。

林语的办公桌上整齐地叠放着各类书籍和论文资料。涂世欣扫了一眼，书籍包括了计算机数据结构、算法、图论、离散数学、概率论和统计学、机器学习等等科目。桌子右上角边上还堆放着各种打印好的文献，用彩色标签分门别类地归档了。

涂世欣低下头，瞄了一眼自己靠放在桌角地上的黑色书包，里头几份打印资料毫无章法地穿插在一起，一本随身背着英文原版《大空头》是李洛推荐的金融趣味科普读物，书角都磨破了，但是自己从来没能一口气读过十页以上。他突然对于自己能有这份工作倍觉珍惜，感激地瞧了李洛一眼。

林语笑了笑，解释：“你提到的这点，正是二者共通之处。至于区别，从研究方法上来说，学习分析技术更注重运用统计学手段主观地分析数据、人为做出推断，为传统教学方式配备了数据反馈作为支持；而教育数据挖掘强调自适应，会倾向于使用无监督或者半监督的机器学习算法。

“从应用角度来说，学习分析技术的主要目的是对学生的学习结果进行测验和监控，为教师提供更详细的学生数据，从而改进教学方法。而教育数据挖掘更注重学习行为和学习过程，意图对行为本身进行量化分析。如果你感兴趣可以去找一下卡耐基梅隆大学教授Ryan Baker的论文，里面有相当详尽的对比。”

除了那教授的名字涂世欣没能听清楚，他飞速地把这几句话一字不差地敲在了电脑上。偶尔他打字的速度跟不上林语说话的节奏，林语还贴心地放慢语速，等了等他。

涂世欣敲完一段后，偷偷瞄了一眼李洛的屏幕，发现李洛只是简略地记了两行。

“学习分析技术（LA）：人为分析、主观、辅助教学手段。”

“教育数据挖掘（EDM）：自适应、无监督模型、行为数据挖掘。”

在最下面，李洛记下了“Ryan Baker”的名字。涂世欣又快速把这位教授的名字补填在了自己笔记的空档里。

李洛好奇地问：“可不可以给我讲一个教育数据挖掘在行业里具体应用的例子呢？”

林语点头，“比方说，现在有一个选择题有四个选项，C是正确选项，其他都是错误的。传统的考试批改方式，老师会这么判断：如果学生选择了C，他对这个知识点的理解就是正确的；没有选择C，则判断学生还没有熟练掌握这个知识点。”

“嗯！”李洛睁着大眼睛十分感兴趣。

林语笑着继续说道：“考试排名依照答题结果来评分，无可厚非。但也许有的同学偶尔粗心，实际上扎实地学懂了这个概念，却手滑填写了B作为答案；也有同学只是运气很好，随机选了个C，恰好答对了。学习系统接下来该如何自适应调整个性化的学习路径，还是需要AI形成更深层次的判断。基于贝叶斯网络的学生知识点追踪模型，可以根据测试题前后其他习题之间的联系来推测学生是否真实掌握了这个知识点，从而尽量避免无效的学习时间，也尽量防止被遗漏的知识点。”

第72章 教育数据挖掘

第72章教育数据挖掘