Electronic Joint Business

Solution for E-Business

创建推荐引擎: 基于 Azure, Hadoop 和 Mahout 的机器学习

喜欢帮助别人的感觉吗? 我们将根据 Stack Exchange 用户回答问题的历史,向他提供一些“建议回答”的问题。这与亚马逊上根据购物记录来推荐商品的经验十分相似。如果你不知道 Stack Exchange 是个什么?建议你登录一下Stack OverFlow。 通过本文,你可以了解如何根据对用户的历史“答案”的分析,来预测他可能可以回答的问题。也许 Stack Exchange 现在的推荐系统比我们实现的要更棒,但这不妨碍我们本着学习的目的来重复造一个轮子。1 我们将要完成以下任务: 从 Stack Exchange 数据集中提取所需的信息 利用得到的信息来构建推荐系统 让我们从最基础的开始。如果你对 Apache Hadoop 以及在 Azure 上部署 Hadoop 完全陌生,我建议你试读一些介绍文章。2 背景 让我们先了解一些“数据科学”的背景知识。分布式机器学习主要用于几个方面: 推荐。用过亚马逊商品推荐吧?主要是根据历史来推测用户喜好 集群。如将相关文档进行分组或者从社区中挑选志同道合的人 分类。为新的项目找一个合适的门类。这通常要对系统先进行“培训”再让系统进行检测 行话“大数据”通常意味着你将要操作一个非常大的数据集。在本文中,我们将要从大数据集中提取的一些数据以供推荐系统使用。 推荐系统 总的来说,以下两种方式都可以用来创建推荐系统: 从与某用户相似的其他用户所回答的问题中查找他也有兴趣回答的问题。 从某用户回答过的问题查找相近的其他问题。 第一种技术称为基于用户的推荐(user based recommendation),第二种技术则称为基于细项的推荐(item based recommendations)。 http://blog.3pillarglobal.com/big-data-and-machine-learning-building-recommendation-engine Building A Recommendation Engine – Machine Learning Using Azure, Hadoop And Mahout […]

, , , ,

Leave a Reply

Your email address will not be published. Required fields are marked *

Time limit is exhausted. Please reload CAPTCHA.