如果您已错过腾讯,就不要再错过科大讯飞!
披坚执锐战神
2017-07-05 23:33:33
  • 点赞
  • 1536
  •   ♥  收藏
  • A
    分享到:
如果您已错过腾讯,就不要再错过科大讯飞

2017-07-03 大公馆2013、雪球 陆家嘴午餐



开篇,不厌其烦,还是先来一段“旧闻”。

6月27日,2017年《MIT科技评论》评选“全球最聪明50家公司”的榜单在北京全球首发。有9家来自中国,分别是科大讯飞(第6位,002230.SZ)、腾讯(第8位,00700.HK)、旷视科技(第11位)、大疆(第25位)、富士康(第33位,02038.HK)、阿里巴巴(第41位)、HTC(第42位)、蚂蚁金服(第49位)、百度(第50位)。



说到这个《麻省理工科技评论》杂志,自1899年创刊以来,可是有一百多年的历史了,作为最具影响力的技术商业类杂志,每年都在推的“全球50大最聪明企业”榜单含金量自然不低。同时呢,评选标准也十分有特点,那些有能力将“高精尖科技创新”与“利益最大化”完美融合的公司,才有可能获此殊荣,可以说这份榜单是对未来会成为行业主导公司的预测,而科大讯飞,代表了智能语音领域的未来前进方向。

除了大公司外,这份榜单上那些今年刚上榜却野心勃勃的公司更值得关注。例如,中国方面排名最高的科大讯飞,这也是这家公司第一次上榜。《麻省理工科技评论》给予科大讯飞的上榜理由为:

“该公司旗下的语音助理技术是中国版的Siri。其实时翻译技术则是杰出的人工智能应用,克服了方言、俚语和背景杂音,可将汉语精准地翻译成十几种语言。”

在当天的榜单发布会上,科大讯飞高级副总裁江涛说到:“与其他科技公司相比,其实科大讯飞过去十几年做的每一件事情都挺笨的。因为相比同时期创业的公司,如今科大讯飞的市值并不大,也不如其他公司那样有着多样的营销模式。但这十几年只做一件事情也有好处,这让公司有了技术沉淀,才有了今年的爆发。”

那么,科大讯飞究竟近期做了什么?我们先来看下边一段视频:



怎么样,是否有一种逆天的赶脚?

一位资深投资大咖这么评论到,“科大讯飞的这一款翻译机(晓译)无疑是一款现象级的世界级产品。实现了科大讯飞从中国走向世界的跨越式发展。你可以想想,每年数以几千万人次计的出境中国游客,每年穿梭在全球数之不尽的中外贸易商,从单机版到APP再到手机应用,——画面太美,不忍直视。”

这位投资大咖一直很看好科大讯飞,他认为,之所以大家都一直以为科大讯飞没有办法实现利润,其实是科大讯飞常年不怠地持续投入,构筑了牢不可破的中文语音识别的行业壁垒,“讯飞只是一直没有释放业绩而已,只要杀手级应用出现,只要时机成熟,这一切都是浮云。”

“其实我们看好科大讯飞,还有其他的预期。比如说近期由APPLE新产品HOMEPOD所带动的智能音响热潮,以及特斯拉国产化所即将引爆的智能汽车热潮。 ——无论如何,这些都离不开中文语音识别入口,科大讯飞都会是当然大赢家。”

“如果说,之前图像识别行业中以海康威视(002415.SZ)为代表的龙头企业,可以达到三千亿元人民币市值,那么在可以预期的将来,比如说五年内吧,语音识别领域,我看,以科大讯飞为代表的龙头企业,市值也应该可以是三千亿元!”这位投资大V显然十分看好科大讯飞。

他认为,语音识别的应用正迎来了历史性机遇。因为智能汽车、智能家居、中外翻译机等的出现,一系列的杀手级应用将接踵而至,执中文语音识别之行业牛耳的科大讯飞,无疑正在构筑的是“音频大入口”的应用平台。

“如果您已经错过了腾讯、如果您曾经错过了海康威视,那么您就不要再错过科大讯飞。中国难得再次出现这么一家世界级的聪明企业,闪电来的时候,您一定要在。讯飞的未来,是星辰大海,未来的中国IT科技界,下来可能将不再是BAT,而是TAX。——就是腾讯、阿里、讯飞。”

下边的文章,源自@雪球。作者是GY_GY。——等等,这么激动人心的关头,当然少不了要先来一段雄壮的背景音乐。

Conquest Of Paradise (征服天堂)
Vangelis - 1492 - Conquest of Paradise (Soundtrack from the Motion Picture)


大音频时代即将到来

今天要分享的是最近一到两个月一直在思考的,消费级科技产品的下一个阶段,谁来主导?综合最近的思考和产业巨头的布局来看,一个以语音为核心的大音频系统,似乎取得了先机。

我们在日常的聊天输入、开车等场景中,越来越多的用到语音输入,语音交互开始取代传统触屏方式成为新的交互方式,而两大切入点目前来看已经明晰。

一是以亚马逊ECHO为首,包括苹果刚发布的homepod在内的智能音箱,以及未来更多的智能硬件,他们主打的是家庭是客厅,试图占据用户在家的时间。



二则是以苹果在iPhone7开始应用的双蓝牙耳机——Air Pods以及未来更多移动端创新产品,在这款耳机发布后,市场中似乎是风平浪静,全球包括国内的各大厂商一改过去蜂拥跟风策略,选择了观望,当所有人都认为Air Pods是一枝独秀,将成为绝唱的时候,产业内早已是风波暗涌。



总结以及顺延趋势来看,人机交互将按照键盘鼠标、触控、全语音、脑电波的路径发展,微软的Windows系统统治了键盘鼠标时代,苹果统计了触控时代,那么下一个全语音时代呢?会是亚马逊这类携上游技术过度到下游硬件呢,还是喜马拉雅这类携中游内容平台过度到下游硬件呢?

大音频上游——语音识别技术

语音交互在目前技术条件下还停留在识别层面,可以说语音识别是人机交互的入口,大公司都希望使用自己的语音识别引擎,以便在应用过程中可以收集到大量有价值的用户数据。 ——这也是为什么科大讯飞愿意让厂商免费使用自己的语音识别软件,未来的大数据时代,语音数据分量不会低。



美国语音技术公司巨头 Nuance 的产品支持超过 50 种语言,在全球拥有 20 亿用户。苹果最早就使用了 Nuance 的技术,但并未减少在自己 Siri 上的投入,而且将 Nuance 和微软的部分高级人才挖了过来,组建了自己的技术团队, 在 Siri 逐步成熟后弃用外部引擎。

谷歌早期通过收购 SayNow 和 Phonetic Arts 进入语音识别领域,后来又借助一系列其他收购逐步完善了语音识别的技术积累, 2016 年谷歌发布语音助手 Google Home 和内置的语音助手 Google Assistant,可识别四种语言。

Facebook 在 2013 年收购了语音识别公司 Mobile Technologies,其产品 Jibbigo 支持多种语言互译,成为出国旅游的常用工具。不久后又收购了语音识别公司 Wit.ai,该公司的技术是通过语音控制移动应用程序、穿戴设备和机器人等智能硬件。 2015 年 Facebook 还测试了旗下智能语音助手“ Moneypenny”。 Facebook 在智能语音行业布局的战略是通过语音交互数据支持其广告投放效率, 并将语音技术用到其将来的 AR/VR 等智能硬件产品中。

亚马逊于 11、 12、 13 年分别收购 Yap、 Evi、 Ivona Software 三家语音识别技术公司, Kindle Fire、 ECHO 智能音箱以及个人助手 Alexa就是基于这些技术。 2016 年亚马逊也积极扩展智能语音助手系列产品线,推出了 Tap 和 Dot 两款新产品。

微软在 skype 时期就着手积累语音识别技术,目前在个人助理Cortana 和微软小冰上实现了应用。 2016 年底微软将词错率降低至5.9%,首次达成与专业速记员持平而优于绝大多数人的表现。

与国外互联网巨头相比,国内的互联网巨头在语音识别上再次走在了后面,因为国内优秀的语音识别公司极为稀缺,即使有钱也找不到目标。

虽然腾讯、阿里、百度等巨头都有自己的语音识别技术,百度还专门从 Google 挖来了人工智能泰斗吴恩达,但是它们在语音识别领域仍然和科大讯飞有明显的差距。

2015 年的“宝马全球中文语音技术测试”中,科大讯飞以车载环境下识别率超过 85%的公司的成绩拔得头筹,比第二名 Nuance 领先很多。

可能很多朋友都会说,国内搜狗、百度和科大讯飞差不多呀,其实这里有一个误区,平常大家在手机上使用的语音识别基本属于近场识别,目前国内优秀的语音识别公司近场识别的准确率基本都能达到 95%-99%, 没有很大差距。

但业内共识是远场识别技术难度高,家居场景中格外需要其应用;相对成熟的产品只有讯飞和京东合资生产的叮咚智能音箱,同类产品在用户体验上相比其它公司明显领先(据说也不怎么样)。



而在远场识别的基础上,语音识别还需要向全声控去发展,目前市面上的所有语音输入软件、智能音箱也好,在进行输入之前,都需要按下语音输入键或进行其他相应操作。

而我想要的是,在厨房忙活着做顿好吃的,手上沾满了油腥,手机放在厨台另一端,我想给回家路上的老婆打个电话让她带瓶醋回来,怎么操作?

只需要凭空喊一声:XX,给老婆打电话,打开免提(或带着蓝牙耳机),在厨台另一半的手机则自动识别并拨通电话,完成操作。

全声控场景的实现基础是远场识别技术,即设备与人相距 3-5 米甚至更远距离下的语音识别。相比手机放在嘴边的近场识别,远场识别具有很高的技术壁垒,首先需要利用麦克风阵列、回声消除等技术将目标说话人的声音增强,同时抑制周围的噪声和回声;其次通过语音识别引擎针对麦克风阵列处理后的数据进行收集、训练,逐步提升识别率。

15 年 3 月科大讯飞全球首发了自己的远场识别技术,在业内处于领先。

从上游来看,国内的科大讯飞可以说是一枝独秀了,也是老生常谈了,问题还是那些问题(变现),语音交互技术企业变现在移动端是很难实现的,重点还是应该放在行业的语音交互应用,如教育、医疗等等,以及下游的智能硬件,这两者更为容易。

一生好运,独尊武神赵子龙!
百战不殆,当成功已成为习惯。
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500