丁雷的话,也代表了船舱中其他几个人的心声。
大数据,是互联网企业发展到一定规模的产物,在国外已经成为了前沿,而在国内,只闻其名,不见其形,并没有成规模的研究。
所谓大数据说白了就是数据挖掘,数据分析,朝小了做,随便哪家互联网企业的数据库,都能号称‘大数据’,但数据量样本太少显然没有任何意义。
web1.0时代,用户从运营商处获得信息,2.0时代,运营商通过收集用户信息,无论在哪个时代,互联网都是围绕着‘用户’服务的,因此2.0时代的用户信息,是宝贵的财富之一。
大数据这项前沿技术,到底如何研究,怎么应用,对互联网会产生什么影响?
这是在场的互联网大佬都迫切想要知道的。
“说起数据中心的具体位置,也是巧了。当初我们三家商议到底放在哪里,争议不下,最后还是赵总一言而定,选了一个折中的地方。”李总呵呵一笑,轻轻一敲桌子,“就在杭城!”
“原来就是阿里巴巴的眼皮子底下,难怪人家盯着你呢。”新浪的曹总半开玩笑对马芸说。
马芸一愣。
杭城那么大,高科技企业众多,那三家又明显有保密意识,之前没有任何宣传,多出一家科技公司,他不知道也很正常。
只是,这未免有些巧合了吧?
前段时间,腾讯和百度都流露出入股阿里巴巴的意向,可都被拒绝了。
而偏偏这个数据中心恰好就在杭城,这两者会不会有什么关联?
看了赵泽君一眼,难道在很早以前,这个年轻的赵总,就对阿里巴巴有什么想法?
赵泽君冲马芸微微点头,然后说:“既然就在杭城,不如吃完螃蟹,大家一起去参观参观嘛。”
“螃蟹回来再吃也不着急嘛,马总,晚上这顿还是你的。”张超阳有些迫不及待的说。
……
由于数据中心的横空杀出,泛舟西湖的计划提前结束,一行人奔赴数据中心。
数据中心似乎早就料到会来,早就布置好了大会议室,在简单的内部参观后,由目前数据中心首先科学家,也是百度方面的代表专家,毛总工程师在会议室里,向在场来宾,大致介绍了数据中心的科研方式和成果。
目前,数据中心已经创建了有效的模型153个,这些模型中,有12个能直接投入应用的,一部分还在不断完善中,大部分是基础模型,并且每个月的数据模型都在高速的增长中。
根据这些模型,总结出有效的数据采集渠道超过五百种,分析、运算公式接近一万个,三方提供的各类数据在清洗后留下的‘有用’内容,存储在整整两层楼的近两百台高端服务器中。
毛总工程师还在现场,做了几个应用展示。
游戏用户模型,可以帮助游戏运营商,找到网络中对游戏感兴趣的用户,通过各种方式宣传,并且在游戏中,诱导消费。
用户浏览习惯模型,可以分析出用户网页的浏览频率、次数、类型等信息,确定一个用户在这段时间内的浏览偏好。这点如果应用到门户网站上,可以帮助网站确定下一步的发展重心,有针对性的进行工作。
至于阿里巴巴方面,毛总也展示了两项相关应用。
当然,这些模型,某一家网站,比如新浪自己也可以单独完成,但是只是针对自身用户,无论在用户的范围、分析的深入程度和模型的概括性上,都远远不能和目前的数据中心相提并论。
百度搜索、泽联科博客、腾讯QQ以及他们的一系列产品,几乎囊括了所有的网络用户,和网络用户的大部分行为。
这项优势是其他任何公司无法媲美的。
数据中心向参会的人员,展现了这一年工作成果的一角,以及未来可能拥有的广阔空间。
毕竟参会者,大多都是‘外人’,不可能把数据中心最核心的机密全部暴露出来,所以原定计划,是泛泛的介绍,用时在一个半小时左右。
但开始后没多久,会议室里的气氛就越来越热烈,在毛总工程师介绍演示的过程中,不断的有人打断、提问,对话和回答的时间占据了大半,到了后来,几乎全是在答疑。
有些话问得太深,毛总没有权力回答,就由赵泽君等三个委员来解释。
原定一个半小时介绍,足足用了三个半小时才结束。
“谢谢毛总工。”百度李总带头鼓掌。
“谢谢几位老总,我先去工作了。”毛总工程师很识趣的把时间和场地,留给了在场的人。
他刚走,张超阳就说:“三位,数据中心,顾名思义,以数据为基础。数据越多越全面,能发挥的作用就越大,应该是这样吧?”