一个例子比较google和baidu使用人群
相关搜索一般都是从高频query挖掘来的?(我猜的, 顺便求教大牛们,商业 SE 一般怎么做相关搜索的?)
google:
落户 上海的相关搜索:
迪斯尼落户上海, 留学生落户上海, 迪士尼落户上海, 落户上海的条件, 海归落户上海, 留学人员落户上海, 父母投靠子女落户上海, 研究生落户上海, 留学回国人员落户上海, 留学归国人员落户上海
百度:落户 上海的相关搜索:
上海落户政策 2011上海落户 上海落户查询 2011上海落户标准分 上海落户打分 , 2011上海落户打分 上海落户条件 上海市落户政策 上海应届生落户 上海落户标准分
但是在搜索“药家鑫”是: google的相关 搜索结果非常“差”:
药家鑫的相关搜索
宣家鑫
万家鑫
家鑫源
家鑫插座
而百度的则“正常”:
药家鑫上诉 药家鑫案 药家鑫二审 药家鑫案二审 药家鑫事件
药家鑫二审结果 药家鑫父母 药家鑫判决结果 药家鑫家庭背景 药家鑫背景
两个例子,可见用户群体以及他们的关注度。
相关搜索 仅仅是在挖掘高频query? 而不会自己去分析出去 网页中的 高频词吗?
商业搜索引擎应该都在分析网页的过程中实践些数据挖掘的算法把
google:
落户 上海的相关搜索:
迪斯尼落户上海, 留学生落户上海, 迪士尼落户上海, 落户上海的条件, 海归落户上海, 留学人员落户上海, 父母投靠子女落户上海, 研究生落户上海, 留学回国人员落户上海, 留学归国人员落户上海
百度:落户 上海的相关搜索:
上海落户政策 2011上海落户 上海落户查询 2011上海落户标准分 上海落户打分 , 2011上海落户打分 上海落户条件 上海市落户政策 上海应届生落户 上海落户标准分
但是在搜索“药家鑫”是: google的相关 搜索结果非常“差”:
药家鑫的相关搜索
宣家鑫
万家鑫
家鑫源
家鑫插座
而百度的则“正常”:
药家鑫上诉 药家鑫案 药家鑫二审 药家鑫案二审 药家鑫事件
药家鑫二审结果 药家鑫父母 药家鑫判决结果 药家鑫家庭背景 药家鑫背景
两个例子,可见用户群体以及他们的关注度。
相关搜索 仅仅是在挖掘高频query? 而不会自己去分析出去 网页中的 高频词吗?
商业搜索引擎应该都在分析网页的过程中实践些数据挖掘的算法把