[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 这门课程和以前各门课程的基本思路一致 特别是,我们采用案例学习的模式 来帮助我们更好了解将要学习的 关键概念 当然,我们在本系列课程中,也采用了一些其他的 特色 尤其是,当在介绍一些机器学习的核心概念时 我们使用案例教学 和视觉辅助来帮助学习 在基础课程之后,我们进入后续课程 我们将要进行一系列算法的细节介绍 我们不是简单给出一个长长的算法清单 它们被使用在聚类和信息提取中, 相反,我们将重点放在那些我们认为被广泛使用 而且具有很高实用价值的算法上 同时,也是那些能给我们最多技能、 能经受时间考验的算法 贯穿本课程始终 通过实现这些算法,你将获得实战经验 你不是简单的实现这些算法就完事 你要把它们应用到真实的应用中 如此,你将获得真实的经验, 把具体的算法应用到数据集上 这些数据集也是来自于我们的真实环境中 这个过程中,你将对算法有很多的直观感受 了解每个算法的限制和能力 最后,我们也将介绍一些高级概念 不过这些都是可选的 如果有兴趣,你可以看下这些(可选)视频, 以便你对我们介绍的一些事情的内在机理有所了解 如果没兴趣,也没有关系 (通过其他视频)你也可以对聚类和信息提取的方方面面有全面的了解 你会实现、应用这些方法 只是对一些证明 或者一些细节概念不甚了解, 这些(可选)视频仅是对那些感兴趣的同学。 好了,具体到本课程 我们要学习一系列不同的模型 比如用于检索的最近邻方法 我们将介绍聚类方法 一种非监督学习任务 我们也将介绍用于聚类的概率模型 比如混合模型 我们还将介绍一种精妙的概率模型 被称作LDA (latent dirichlet allocation) 的模型 然后,我们将介绍一系列算法 用以对应这些模型 比如,KD树 (KD-tree)作为高效数据结构 来解决最近邻搜索, 局部敏感哈希(locality sensitive hashing) 和k-均值被用以聚类 同时还有MapReduce 作为一种并行算法的框架 最大期望算法来解决混合模型和 吉布斯抽样用于LDA模型 同时也是很重要的一点,在课程中 我们要涵盖很多 基础的机器学习概念 这些概念将拓展到聚类和信息检索以外的范围 我们还要讨论距离度量 还有近似算法 非监督学习 概率模型、数据并行问题及 贝页斯推断 可以看出,这门课程确实涵盖了很多内容 翻译[张晓刚]