[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 好的 我们已经相当详尽地讨论了聚类这个概念以及 它在文件检索中的应用 然而还有许多 其他的聚类的应用实例 我想要花点时间来讲讲其中的一些 其中一个应用是图像搜索 那么想象一下你上来要搜索 你上了谷歌图片搜索 输入关键词海洋 那么很有用的一点是能够把所有的图片组织分类成 诸如海洋 粉色花朵 狗 日落 云彩 等等的类别 因此聚类算法对结构检索颇有益处 另一个非常不同的应用是我们可能会想要将病人 根据病况进行分组 所以这里的目标可能是更好地 特征化疾病亚种和不同的疾病 举例来说 我们可以锁定一组癫痫患者 这里的三个大脑代表三个不同的病人 而 他们有各自的癫痫发病活动的记录 对这里的每个病人我们都有一系列 按时间追踪的不同癫痫发作的记录 这里的每个有色方块都代表 一条不同的记录 在这些不同的病人身上可能会 发生相似类型的癫痫发作 我们可以拿这三个病人的所有病情记录 来考虑如何聚类 如果我们用这种方法识别出了癫痫的不同类型 那这就能让我们更好地对症下药 根据他们表现出的癫痫类型来进行治疗 那另一个应用是在亚马逊上进行产品推荐 比如说 在亚马逊上会有一些第三方卖家 他们会发布代售的产品 并且用标签来标示产品属性 比如说 有一个人打算卖一个婴儿车 他们把这个婴儿床相当合理地标记为家具 那么我们可能会把它发布到家具类下面 那如果我们改从这项物品的购买者的角度来考虑呢? 我们来看看他们的购买记录和 其他有相似购买记录的消费者 那么这些购买者很可能还买了婴儿汽车座椅 然后我们可能以此出发 可以为这个婴儿床加上一个更好的标签 原来的家具标签其实应该被改成婴儿用品 因此我们不仅可以发现相关联的产品 基于这些物品的购买记录我们也可以 来发现亚马逊上相关的用户族群 这些信息可以被用来设计对这些用户的定向产品推荐 最后我们可以考虑组织网页搜索的结果 比方说 搜索词可能有多重意思 比如单词 "cardinal" 如果我在谷歌中输入这个词 我可能想找一篇关于北美红雀的文章 可能是想搜索圣路易红雀棒球队 又或者可能是关于宗教人士红衣主教的新闻 因此如果我们可能根据内容来组织这些文章 用我们在这个模块里讲到的思路 我就可以优化我提供给用户的搜索结果 类似的应用实例还有很多很多 另一个很有意思的问题是 想一想社区的集合 以及一些需要查找相似社区的实际问题 其中一个是如果我们想要估计一个房子的价格 并且是对 一个相当小的地区中的房子做估计 在这种情况下 很有挑战性的一点是我们只有非常少 或者 在很多时候 没有任何在这个小的地区中的房屋出售的信息 那如果我们想要对这个社区中的房子进行估价 当前来看是非常困难的 因为我们在这个社区中找不到参照点 但是 如果我们发现其他社区有 相似的房产情况和相似的房价波动趋势 那么 我们还是可以较好地估计出这个社区的房价 即使 这个社区中没有或者少有房屋交易记录 我们仍可靠利用这些其他的社区中 的信息来推断 因此 用这个对社区进行聚类的想法 在相同集群中我们可以实现对房屋交易这样的信息的共享 并且得到更好的评估结果 所以我这里描述的解决方案 就是对 又相同趋势的区域进行聚类 并且对集群内实现信息共享 这个识别相关区域的点子还可以用来帮助 预测犯罪率 以此来优化各个区域的警力配备 那么一旦我们发现不同的社区有非常 相像的犯罪活动的动态 我们就能更好预测 那些社区的犯罪率并 用来优化那些区域的警力 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community