1、体育赛事预测
世界杯期间,谷歌、百度、微软和高盛等公司都推出了比赛结果预测平台。百度预测结果最为亮眼,预测全程64场比赛,准确率为67%,进入淘汰赛后准确率为94%。现在互联网公司取代章鱼保罗试水赛事预测也意味着未来的体育赛事会被大数据预测所掌控。
“在百度对世界杯的预测中,我们一共考虑了团队实力、主场优势、最近表现、世界杯整体表现和博彩公司的赔率等五个因素,这些数据的来源基本都是互联网,随后我们再利用一个由搜索专家设计的机器学习模型来对这些数据进行汇总和分析,进而做出预测结果。”---百度北京大数据实验室的负责人张桐
2、股票市场预测
去年英国华威商学院和美国波士顿大学物理系的研究发现,用户通过谷歌搜索的金融关键词或许可以预测金融市场的走向,相应的投资战略收益高达326%。此前则有专家尝试通过Twitter博文情绪来预测股市波动。
理论上来讲股市预测更加适合美国。中国股票市场无法做到双向盈利,只有股票涨才能盈利,这会吸引一些游资利用信息不对称等情况人为改变股票市场规律,因此中国股市没有相对稳定的规律则很难被预测,且一些对结果产生决定性影响的变量数据根本无法被监控。
目前,美国已经有许多对冲基金采用大数据技术进行投资,并且收获甚丰。中国的中证广发百度百发100指数基金(下称百发100),上线四个多月以来已上涨68%。
3、市场物价预测
CPI表征已经发生的物价浮动情况,但统计局数据并不权威。但大数据则可能帮助人们了解未来物价走向,提前预知通货膨胀或经济危机。最典型的案例莫过于马云通过阿里B2B大数据提前知晓亚洲金融危机,当然这是阿里数据团队的功劳。
4、用户行为预测
基于用户搜索行为、浏览行为、评论历史和个人资料等数据,互联网业务可以洞察消费者的整体需求,进而进行针对性的产品生产、改进和营销。《纸牌屋》选择演员和剧情、百度基于用户喜好进行精准广告营销、阿里根据天猫用户特征包下生产线定制产品、亚马逊预测用户点击行为提前发货均是受益于互联网用户行为预测。
5,人体健康预测
中医可以通过望闻问切手段发现一些人体内隐藏的慢性病,甚至看体质便可知晓一个人将来可能会出现什么症状。人体体征变化有一定规律,而慢性病发生前人体已经会有一些持续性异常。理论上来说,如果大数据掌握了这样的异常情况,便可以进行慢性病预测。
例如大数据应用在医疗行业的经典案例。
1,Valence Health: 提升医保结果和财务状况
Valence Health 使用MapR公司的数据融合平台(Converged Data Platform)来建立一个数据湖并作为公司主要的数据仓库。 Valence每天从3000个数据输入源接收45种不同类型的数据。这些关键数据包括实验室测试结果、患者健康记录、处方、疫苗记录、药店优惠、账单和付款, 以及医生和医院的账单, 这些都用来提升决策来改善医保结果和财务状况。该公司快速增长的客户和日益增加的相关数据量正在压垮现有的技术基础设施。
2,UnitedHealthcare: 欺诈,浪费和滥用
UnitedHealthcare 为近5千1百万用户提供健康保险和服务。和该公司合作的有超过85万医师和护理人员,全国范围内大约有6100所医院。他们的账目完整(Payment Integrity)小组的艰巨任务是确保所有账单都按时正确付款。面对每天超过1百万个的账单(10TB的数据),他们之前的处理方式是特制的,严重依赖于规则,并受制于数据孤岛和碎片化的数据环境。UnitedHealthcare 采用了一个独特的双模型策略,既集中关注业务收益,同时也追求利用最新的技术来不断创新。
他们是这么做的:针对业务收益,该集团建立了一个预测分析’工厂’用来系统地可重复地识别不准确的账单。Hadoop用做现在一个单一平台的数据框架,该平台上建有多种工具来分析各种信息,包括账单,处方,医保参与人,合作医护人员,以及账单审查结果。
他们集中了业务里所有数据孤岛的数据,包含36处数据资产。他们手边现在有多个预测模型(PCR,确定欺诈True Fraud,Ayasdi 等),这些模型提供了一个潜在的欺诈排序列表,使得他们可以有针对性地和系统化地处理欺诈。
例如;大数据应用其他案例:Google成功预测冬季流感。
2009年,Google通过分析5000万条美国人最频繁检索的词汇,将之和美国疾病中心在2003年到2008年间季节性流感传播时期的数据进行比较,并建立一个特定的数学模型。最终google成功预测了2009冬季流感的传播甚至可以具体到特定的地区和州。
微软大数据成功预测奥斯卡21项大奖。
2013年,微软纽约研究院的经济学家大卫罗斯柴尔德(David Rothschild)利用大数据成功预测24个奥斯卡奖项中的19个,成为人们津津乐道的话题。今年罗斯柴尔德再接再厉,成功预测第86届奥斯卡金像奖颁奖典礼24个奖项中的21个,继续向人们展示现代科技的神奇魔力。
大数据应用案例之电子邮件。
MailChimp的核心业务是提供电子邮件服务,它在一年内为大约300万用户发送了350亿封邮件。不过真正能体现MailChimp未来价值的则是该公司对这些邮件数据的处理和分析。
MailChimp的一个重要任务就是搞清楚如何帮助客户更好地了解他们所发送的信息。考虑到这一点,该公司建立了一个服务叫Wavelength,向客户展示了与他们相似的其他讯息。这个系统使得Wavelength能够储存公司数据库中每个邮件地址发生的互动。这意味着告诉了你,用户打开了什么样的邮件,何时打开,他们点击了什么链接,还有订阅了什么邮件。MailChimp也有一个功能叫做Ecommerce360,能让客户通过转换来跟踪点击。
文章内容来源于网络,侵删