中国领先的工业平台

返回贤集网 返回微头条
贤集网技术微头条APP获取

为防住搜索内容被其他品牌偷取,百度百科屏蔽部分搜索引擎

 科技仓

下载贤集网APP入驻自媒体

近日百度百科开始屏蔽谷歌和必应等大多数搜索引擎,预计是为了阻止这些搜索引擎和其他爬虫,未经授权抓取百度百科的内容用于训练AI。

百度百科的robots.txt文件显示,目前仅有百度搜索、搜狗搜索、中国搜索(Chinaso)、YYSpider和宜搜搜索(EasouSpider)等少数几个搜索引擎被允许抓取其内容。

谷歌搜索、必应搜索、微软MSN、UC浏览器的Yisouspider以及其他一切搜索引擎爬虫均被明确禁止抓取百度百科的内容。

最新回复
发布回复
回复科技仓:别谈出发点,要看结果。内容的垄断也是垄断,不知道在中国违法不?
回复科技仓:可能损害美国公司利益,可以在美国法院告百度。robots.txt这个东西是美国发明的,得到全世界认可
回复科技仓:工信部应该禁止这样搞,也要禁止不登录不给看,垄断企业应有社会责任。
回复科技仓:百度自己就是抓取数据起家的,你不能管别人抓取数据用来做什么。
回复科技仓:你这话恰恰应该说给那些搞模型训练AI的企业,随便抓取别人网站的信息作为自己的答案,还不标明信息来处,给你你愿意给他人做嫁衣?让人家白嫖?

为您推荐

热门交流