研究方法
报告中数据的收集和分析采用了(一)在线问卷调查与(二)网络数据发掘两种方法。
(一)在线问卷调查
1. 调研方法
本次研究采用了在线问卷调查方法,通过百度的产品或相关频道投放通栏广告和文字链接广告。投放的位置选择上,尽量选择无固定网站使用偏好用户点击的位置,比如百度知道的内容页,用户可以通过第三方搜索引擎到达这个页面,并不一定是百度的用户。这类用户约占回收样本的64%;另一部分则可能是有较强百度产品使用偏好的人群(平均每天至少使用1次百度产品),这类人约占36%。严格来说样本人群的网站使用偏好与互联网总体有一定的偏差。
性别:男性用户(63%)是此次调研中的主要参与者;
年龄:24(67%)岁以下的用户是此次调研的主要参与者;
教育背景:本科/大专学历用户(47%)是此次调研的主要参与者;
职业:学生(54%)是此次调研的主要参与者。
(二)网络数据发掘
1. 搜索引擎数据发掘
我们对百度各产品线的搜索日志数据进行发掘,涉及的产品有网页搜索、图片搜索、视频搜索、新闻搜索等等。根据
2. 社区数据发掘
我们采用统计与文本分析的方法研究社区数据,分析百度贴吧各吧中帖子每天的数量,以及帖子的内容,对热门的帖吧与帖子进行了描述,并用文本分析的方法研究网民的观点与关注度所在。社区数据是用户产生的内容,具有社会媒体的意义。


