• 由豆瓣想到的

    2008-06-30

    Tag:

    版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
    http://www.blogbus.com/zhaoming1987-logs/23826450.html

          豆瓣网的出现是很久以前的事情了,到最近才真正接触到,给我的感觉是惊艳!

          在豆瓣上能够轻易的找到你喜欢的书、音乐、电影、志同道合的朋友等等,你会发现当你走出第一步的时候你就已经陷下去了,豆瓣会根据你留下的脚印把那些你可能喜欢的东西放到你的眼前,而巧的是你会发现推荐菜单的就是自己想要的,让人不知不觉在一个又一个惊喜中在电脑前面坐一整天。

          夸完了,现在来讲问题。人们早已告别了信息匮乏时代,进入了信息过剩时代和媒介的相对过剩时代,另一方面,人们的生活节奏加快,所以注意力成了信息时代的稀缺资源,因此豆瓣把你想要的推到你面前是非常讨巧的做法。但它并没有解决这个问题,当然它也解决不了,问题就是它把一大堆我不需要的信息过滤掉了以后反而给了我更大的负担,因为现在我的问题不是从沙子里把石头挑出来了,而是面对一大堆石头不知道该先搬哪块,更让人绝望的是你很明确的知道你永远也搬不完这些石头。

        出题时间到,这个问题问我们的技术总监的。豆瓣是通过什么技术把用户信息的相关性做的这么好的?

    分享到:

    评论

  • 你耍我啊!
  • 具体的你可以搜索一下数据挖掘的相关信息。囧~敲的累死我了。。。
    回复水若寒冰说:
    其实这些偶也知道哈,哈哈哈哈哈~~~
    没想到你打这么多,其实我对豆瓣程序的逻辑很感兴趣,非常有意思
    2008-06-30 19:21:14
  • 当你在系统中输入“后天”以后,网站服务器通过模糊搜索技术,除了将你明确指明的信息如“后天”直接对应的信息暨电影《后天》的相关资料呈现给你意外,还会以后天这个数据库记录中所存储的那些信息标签为关键字再次检索数据库,并呈现出相关信息,以相关度(即检索出来的信息符合查询关键词的多少)将搜索结果排序并显示在网页中。
  • 这个实现的技术有好多种,每一种如果展开讲都可以写成一本书,所以还真的没法说清楚。主要涉及到这样一些技术吧:先是数据录入,在录入基本信息的同时也会录入一些关联信息,比如录入电影《后天》的基本信息的同时,也会录入一些关联性数据如因为这是一部灾难片,来自美国好莱坞出品,导演是罗兰·埃默里赫 (Roland Emmerich),同时也带有一定的科幻类型色彩,出品年份是2004年,根据以上信息,网友或者网站编辑就会录入一些能代表这些信息的标签,如:灾难片,后天,科幻,2004年,罗兰·埃默里赫,美国,好莱坞……