大趋势 | 数据智能:大数据迈入下半场

2019-05-09
萌泰科技 周峰
摘要:大数据进入下半场,人工智能已然崛起,现有的大数据技术亟须和人工智能技术结合,孕育新的产业生态。
大数据进入下半场,人工智能已然崛起,现有的大数据技术亟须和人工智能技术结合,孕育新的产业生态

大数据发展步履蹒跚

随着2012年舍恩伯格《大数据时代》一书的出版,“大数据”这一概念在全球掀起了新一波信息化浪潮,它不仅在信息技术行业备受瞩目,更成为变革商业、学术、政府治理乃至人类思维方式的一股举足轻重的力量。得大数据者得天下,业界纷纷用大数据这个词来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的各类创新技术、产品和解决方案。
2013年被称为中国的“大数据元年”,这一年,涂子沛的《大数据》一书成为畅销读物,大数据开始在我国流行,其以势不可挡的姿态进入人们的思想意识,并逐步在社会的各个领域落地应用。2014年,百度在第四届“技术开放日”上正式宣布推出“大数据引擎”,并由此引出了“数据智能”的概念;同样在2014年,在北京举行的一场大数据产业推介会上,马云第一次提出DT(Data Technology)时代的观点,他指出“IT时代把人变成了机器,而DT时代把机器变成了智能化的人,我们正在进入一个新型的时代”。2015年,我国政府通过了《关于促进大数据发展的行动纲要》,大数据更是上升为国家战略。
舍恩伯格在其书中指出,大数据包括三个核心要素:技术、数据和思维。数据往往被看作是21世纪最重要的“石油”,而大数据技术也可以被看作是提炼这种“石油”的设备和技术。事实上,随着互联网、移动互联网、无线通信技术、传感器技术以及人工智能算法的快速发展,“数据”和“技术”本身都已具备充分的条件。尤其是“技术”领域,比如Hadoop技术,在这个数据大爆炸的时代,企业需要对海量数据存储、快速处理和分析,Hadoop正是为此而生。在很长一段时期内,Hadoop几乎成了大数据的代名词。
然而,尽管大数据的宣传攻势凌厉迅猛,其技术发展也如火如荼,但其面向各行业、各领域的“攻城略地”的过程中却显得后劲不足。首先,大数据的价值被夸大,在投入产出比上差强人意。其次,大数据的落地应用有限,缺乏被高度认可的示范性应用,目前看来,大数据需求主要来源于一些大型企业的自身发展需要以及政府对大数据治理的一厢情愿。最后,大数据管理难度大,数据开放共享、数据质量、数据安全、个人隐私信息保护等已经成为大数据管理面临的重要难题。
能否解决以上问题将直接关乎大数据的未来发展。

人工智能方兴未艾

人工智能(AI)是研究用于模拟与延伸扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,目前在商业和生活中已有大量应用场景,被业界寄望为下一轮技术革命,对它的关注热度已经超过大数据。
AI已经替代了早些年的大数据,成为新的商业科技风口。2017年全球AI融资超150亿美元,谷歌、亚马逊、苹果、微软以及阿里、百度、腾讯等中美科技巨头纷纷布局。以深度学习为代表的AI算法,PC/移动互联网上海量、多维度、高价值大数据,以及以GPU、FPGA、ASIC为代表的AI计算芯片,成为本轮AI发展的核心驱动力。
AI技术体系一般分为基础层、技术层和应用层,在AI大发展的浪潮中,AI技术体系中的各模块发展特点各不相同。基础层对应着算法(包括回归、分类、聚类、深度学习算法等)、算力(即AI芯片)和软件框架(实现对AI算法的封装)。技术层负责解决具体类别的AI技术问题。其中语音识别技术负责将语音转换为文本或命令,自然语言处理技术实现人和机器之间的自然语言通信,计算机视觉技术用于处理图形图像和视频内容的识别。应用层立足于解决各行业领域实际场景问题,如安防场景下,用于警讯发现、人脸识别、道路监控等;金融场景下,可用于资产异动监测、征信风控和智能投顾等;医疗场景下,可应用于对医学影像、电子病例处理来辅助诊疗;还有目前最为火热的自动驾驶场景。

大数据为人工智能发展提供了基础资源,人工智能技术的核心就在于通过计算找寻大数据中的规律,对具体场景问题进行预测和判断。由于创新的大数据思维不易获得,人工智能技术某种意义上恰恰可以弥补舍恩伯格提出的大数据三要素中的“思维”要素。
大数据的未来何去何从,与人工智能技术如何完美结合,共同驱动数字经济发展,数据智能或将成为新的热点和大趋势。

掘金数据资产,探索数据智能

“数据智能”是百度公司在2014年提出的概念,百度对数据智能的定义,指基于大数据引擎,通过大规模机器学习和深度学习等技术,对海量数据进行处理、分析和挖掘,提取数据中所包含的有价值的信息和知识,使数据具有“智能”,并通过建立模型寻求现有问题的解决方案以及实现预测等。
2018年10月, 第五届中国国际大数据大会上发布的《2018年数据智能生态报告》中提出,在机器学习、分布式计算等技术发展的基础上,数据逐渐呈现出高维度、高阶态、异构性的形式,把能够对海量数据进行分析、处理和挖掘,并且通过建模、工程等方式来解决实际预测问题,最终实现决策的行动,称之为数据智能。
对数据智能的信息化落地,业界一般称之为数据智能平台或数据中台。
2015年,阿里巴巴首次提出数据中台战略。该战略旨在对内提供数据基础建设和统一的数据服务,对外提供服务商家的统一化数据产品。基于阿里数据中台输出的生意参谋产品,是阿里巴巴首个统一的商家数据产品平台,为中小企业商家提供数据披露、分析、诊断、建议、优化、预测等多项数据服务。
百度也在2018年整合了旗下各类大数据和人工智能应用,推出了百度数智平台。该平台定位为提供大规模机器学习、深度学习、数据分析及展现、数据应用等产品与服务,百度公司将其数智平台定位为AI时代的企业数据管家,服务于公司内部和各行业合作伙伴。


大数据进入下半场,人工智能已然崛起,现有的大数据技术亟须和人工智能技术结合,孕育新的产业生态。从百度、阿里的做法可以看出,向数据智能型企业转型正在成为大型科技企业新的行动方向,阿里巴巴提出的“大中台、小前台”的做法已经成为业界主流数字化转型思路,企业通过建设数据智能平台或数据中台,打破内部数据壁垒、盘活数据资产、提升数据价值,对外提供统一的智能化数据服务,有望再次重构大数据产业生态环境,进一步深挖和释放大数据的价值红利。


编制注:本文主要基于环球网于2018年11月20日发布在百度百家上《数据智能是大数据的未来》一篇媒体报道修改。
    发表评论
    评论通过审核后显示。