针对号称“信息入口”的搜索引擎,一份“魔鬼辞典”在互联网业界正悄然流传.
2月17日,记者获得了一份来自“反流氓软件联盟”网站的“魔鬼辞典”.这是一组Excel文件,上面详细统计了百度竞价排名业务中,医药医疗部分的关键字,其中包括了上万个涉及灰色领域的医疗竞价案例.
2008 年9月,本报曾报道《搜索引擎之过:虚假医药广告泛滥互联网》;2008年11月,中央电视台又曝光了百度竞价排名中的虚假医药问题.当时百度随即宣布将对此进行整改.11月19日,百度召开的分析师电话会议上,百度CEO李彦宏表示,百度已经紧急下撤了1000家没有执照的关键词客户公司.
然而,“辞典”文件显示了分别在2008年10月17日、11月27日和12月14日利用爬虫技术萃取出的百度关键字竞价统计,这三个时间段中,医疗医药竞价排名广告分别占百度竞价排名广告的30.02%、27.50%和36.62%.显然,百度的医疗广告并没有大幅减少.
除此之外,值得注意的是,在起伏变化的数字后面,当百度的关键字将用户导向了违规医药网站时,又是什么原因让这些网站继续存活下去?事实上,据记者调查,由于多个环节的疏漏,一个按照“虚假注册ICP—关键词改头换面—搜索引擎传播—引诱患者 ”方式运作的地下网络医疗产业链正在悄然形成.
产业链入口:搜索引擎
根据辞典的数据,去年10月17日,百度医疗医药类广告条目数有322200条.在央视曝光后,11月27日,医疗医药类广告剩下299320条.
然而随后的几个月,这些关键字又重拾升势.12月14日,由于采用了更加完善的技术方式,医药医疗类广告条目数为646639条,辞典称,由于技术提升,12月的数据不能和前两个月作比较.“但1月份采取的技术和12月相同,可以进行比较.”2 月18日,反流氓软件联盟创建者董海平告诉记者,1月份初步统计中,医药医疗类广告条目数增加到69万多条.
据董海平介绍,每个月都会萃取一次新的数据,萃取时采取了与搜索引擎类似的爬虫技术,每次萃取时间持续一周,萃取完成后的原始资料再通过人工整理成为报告, “还会对其他的搜索引擎进行萃取,原计划在1月份公布数据,但由于别的网站数据还没有完成,因此公布时间定在三月.”
对于这份报告的数据,记者2月18日致电百度,百度方面表示对此不予置评.
“央视报道后,百度关键字竞价上原来大量的癌症、肿瘤这样的词汇是没有了,但是,更加隐蔽的词汇照样没有撤,比如治疗性病撤掉了,但是又做了其他许多变换词,比如男性性病,女性性病,性病有哪些等等.”董海平说.
根据国家工商行政管理总局、卫生部、国家中医药管理局关于规范医疗广告活动加强医疗广告监管的通知中的规定,尖锐湿疣、梅毒、淋病、软下疳等性病;牛皮癣(银屑病);癫痫;乙型肝炎;白癜风;红斑狼疮等严禁做任何形式推广及广告用语.
然而,根据12月14日的萃取结果中,性病类的竞价排名广告关键词就高达2071个.在百度投放“淋病”关键词广告的广告主数为211家,平均竞价排名价格为25.93元,最高广告出价达到38.57元.广告主的地域分布中,北京、河南、上海、广东、江苏分列前五位.
不少业内人士对记者表示,百度的医药竞价排名将可能出现回潮,由于缺乏外部监督,没有足够的数据,很难保证其后续效果.对此,一位记者熟悉的百度内部人士表示,并非所有的医药广告都是非法的,百度目前选取的医药广告都有合法证明.
然而,根据辞典的关键词表,记者看到,大量的涉性的名词被隐藏在句子中,整个句子被用作关键字.关键词越来越长,是竞价排名的新趋势之一.在记者随即选取测试的范围内,该辞典提供的关键字在百度上都做过推广.
改头换面:3035个关键字的网站
在10月17日的萃取文件中,一个叫做264mn.com的网站注册了3035个关键字,每个关键字的价格从18.57元到0.3元不等,如果按这3000多关键字每天被点击1次计算,该网站每天将向百度支付4716元.
然而,记者根据该文件提供的关键字,通过百度关键字查询系统对264mn.com网站进行查询时,却并没有查询到该网站.原来,该网站已经换了一个名目继续出现.
在 2月17日记者的查询中,另一家域名为264yy.com的网站位列其中.打开264mn 和264yy两个网站来看,均属于一个叫做“中国人民解放军第二六四医院”的地方,所留地址和健康热线号码也相同,这两个网站实际上同属于一个机构.根据记者调查,在264mn从百度竞价排名撤销后,又换上了264yy继续做广告,其所选关键字亦与原来完全一样.
记者从工信部网站查询系统http://www.miibeian.gov.cn/查询获知,264mn所注册的ICP证在审核中,而264yy没有记录,这说明两个网站都是非法网站,然而在百度审核程序下均通过了检测.