人工智能与新基建之四:AI产业的血液—大数据
华富基金
2020-04-03 09:07:08
  • 2
  • 评论
  •   ♥  收藏
  • A
    分享到:

大数据在人工智能产业中的作用


大数据就像人工智能产业的血液,流淌在AI产业链中的各个环节。从前端物联网和车联网的数据采集、5G网络的传输、数据中心的存储,再到最后计算的应用,大数据串联了新基建的各个领域,也让智能应用最终得以实现。

数据是人工智能算法的基础,是训练人工智能模型的“原材料”,而大数据的“大”,不仅仅体现在数据量上,更体现在数据维度的增加上,机器学习教科书中有个啤酒与尿布的经典案例:美国超市管理人员分析销售数据时发现了一个令人难于理解的现象,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中。后续调查分析发现,一般是母亲在家中照看婴儿,而年轻的父亲前去超市购买尿布时,往往会顺便为自己购买啤酒。于是超市将啤酒与尿布的货架放在一起,果然大大提升了两个商品的销量。

这个案例充分说明数据维度扩展的重要性,不能仅仅局限于与目标最高度相关领域的信息,多维度数据分析往往能获取更多意想不到的增量信息,进而提升机器的智能,近年人工智能产业的发展,与数据采集、存储能力的提升,进而形成可供应用端进行更深入分析的大数据是有很大的关系的。

大数据的市场规模

未来是数据爆炸的时代,目前仅互联网,每分钟即可产生数千Gb的数据,涉及人们日常生活的方方面面。

其余在线或移动金融交易、社交媒体、GPS坐标等数据源每天要产生超过 2.5 EB(1EB 为 2^60 次方)的海量数据。据 IDC 预计,全球数据总量增长率将维持 50%左右,2020 年全球数据总量将达到 40ZB;中国将达到 8.6ZB,占全球的 21%。根据中国信息产业研究院的数据以及IDC圈数据,2019 年中国大数据市场规模约为 1600 亿元,同比增长 35%;预计未来几年,随着应用效果的逐步显现,中国大数据市场规模还将维持 30%左右的高增长。

大数据子行业构成及商业模式


大数据主要分为收集、存储和分析利用三个环节,三类公司的核心竞争力有所不同,对应其盈利模式也有所不同:

车联网和物联网:数据源是大数据应用的起点。车联网与物联网公司主要围绕源数据的获取、清洗、处理、关联等的数据第一步加工。其核心竞争力在于占据数据入口优势,通过自身多年收集或向外部购买,形成自己独特的数据资源。向客户提供经过第一层次处理的行业核心数据。例如在人工智能指数中的四维图新千方科技,两者都是车联网中重要的交通数据提供商,四维图新出售的为自己多年积累收集的高精度导航数据,千方科技则是通过外部购买源数据的方式整合了导航信息,公共交通信息,路况管制信息,出售整合好的智能出行综合数据。

大数据中心:主要将前述已经收集整合好的数据,进行高效的存储,为云计算的PaaS和SaaS公司提供包括服务器存放场地、设备、网络带宽、技术支持与集成等综合数据存储服务。其核心竞争力在于提供效率更高的存储能力和连接速率。为达到目标,所建设的数据中心需具有在一线城市达到更严格的能耗指标要求的技术能力。人工智能指数中,宝信软件光环新网等,均是从事大数据中心建设的公司。

人工智能应用公司:主要通过大数据的学习与模型训练,将人工智能应用场景最终实现,核心能力为对智能应用场景的深刻理解,以及对应人工智能算法方面的深耕。具体盈利上,又依据数据的来源分成两大类,一类是像海康威视科大讯飞这样的公司,拥有自己的视频或语音的数据生态,凭借对智能图像识别和语音识别算法的优势(均为全球龙头),售卖以此驱动的各类产品。另一类则如易华录东方国信等公司,虽然数据并非自有,但凭借多年在政务、工业领域软件开发,对行业理解深刻,在数据分析算法层面实现了对行业痛点效率提升的智能优化,进而获得行业内的市场份额。

人工智能指数各子行业权重分布

人工智能产业指数(931071)中,大数据上述三个核心环节均有所涉及,总权重达到了71%,其中物联网5%,车联网15%,大数据中心19%,人工智能应用(含云计算SaaS层公司)32%。

大数据各个子领域中,物联网受限于5G基础设施的建设,当前尚处于快速发展的前期,车联网同样受限于无人驾驶技术的成熟,和各国政府法律法规上的允许,也处于产业快速发展的前期。大数据中心作为基础设施,其盈利的确定性和成熟程度,在当前较高,未来随着数据的爆炸式增长,将具有较为确定的稳定成长性。而下游大数据各个智能应用领域,其成熟度主要取决于各领域可利用的大数据的积累。例如,视频和语音数据的积累和标识历经数年后已具备产业化基础,对应AI算法也相对成熟,使得这两个产业也处于相对较确定的稳定成长期,其余生活各领域数据还有赖于物联网和信息化发展的进一步积累,成熟度相对语音和图像识别领域稍低。

人工智能产业指数所特有的AI营收调整市值选股加权方式,在各个子领域的权重分配,可基本和其成长性及成熟度成正比。大部分权重均分配在了当前盈利确定性较高的大数据中心(19%),和相对成熟的智能图像视频识别和语音识别这两类人工智能应用上(20%),成熟度较低的其余领域的权重相对较小。

515980的指数设计,均是从产业发展规律出发,各行业的权重分配可大概率达到优化产业投资回报的目的。



华富中证人工智能产业ETF联接A/C (008020/008021)正在火热募集中,敬请关注!


风险提示:


本文作者为华富基金指数投资部基金经理,仅代表作者个人观点,不代表任何机构观点。

投资有风险,决策需谨慎。

(来源:华富基金的财富号 2020-04-03 09:07) [点击查看原文]

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500