首页 科技 电脑 手机 安卓 苹果 VR 站长 游戏

您的位置:咪哚网 > 科技 > 人物观点 >

科大讯飞刘聪:能带其他公司一起赢的,才是伟大的公司

咪哚网(www.midoo.cc)时间:2018-11-29 09:10 稿源:虎嗅 手机扫描分享

  在“虎嗅2018 F&M”创新节上,科大讯飞AI研究院执行院长刘聪作为“能量馆”的演讲嘉宾,和观众分享了讯飞——这家深耕人工智能十余年的公司,对AI热潮的理解,以及对于未来的预测。同时,“讯飞听见”为“虎嗅F&M创新节”全程提供语音转写技术支持。

  人工智能在当下无疑是技术的热潮,刘聪认为,当下技术的主题是讨论如何落地,如何赚钱,技术能不能产生商业价值。有三种创新的模式可以引领AI的浪潮:产品的创新和微创新、商业模式的创新、源头技术的创新。而科大讯飞这种“爬山型”的源头技术创新,是最困难的,也是最孤独的,因为一两年内很难看到结果。

  刘聪说,科大讯飞1999年成立以来,在语音识别等技术上做了很多的积累,而现在主要的人机交互方式,他认为会是“基于视觉呈现的语音交互”。

  未来,每家公司都需要有自己的人工智能技术,但并不意味着每家公司都需要从零开始自己做。未来的竞争,一定是生态的竞争,而讯飞愿意做行业的赋能者,开放自己的AI能力帮助更多的公司,去实现合作共赢。刘聪也认为“只有成为商业生态系统当中的核心节点,整合各种资源,并且把整个的系统带动起来,实现共赢,这样才是伟大的、有影响力的公司。”

  以下为刘聪在虎嗅F&M节演讲全文,略经虎嗅编辑:

  各位年轻的小伙伴大家好,今天非常高兴能来参加虎嗅F&M创新节,这样一个非常有特色的会,我也是虎嗅的粉丝之一,虎嗅的网页也是我搜索栏里前几个收藏之一,经常通过虎嗅能帮我来获得一些相关的信息以及八卦,也能在一些不相关的领域对我产生一些科普——看了虎嗅早报之后,可能微博都不用刷了。

  前几天我看到了一篇文章,叫做《算法工程师的危机》,里面提到现在工程师是调参的,调参这件事儿小学生都能做了吗?

  另外一种说法是现在后端的研究员得抛弃自己高高在上的姿态去走向前端,去背上业务的KPI,去和业务贴身肉搏,虽然这可能不是全貌,但的确也反应了一些现象。作为我个人来说,从原来做技术到现在的技术管理,从原来做语音识别到去负责计算机视觉,我是蛮焦虑的,因为我也是个工程师。

  如果从公司的角度出发,我们知道讯飞经常说顶天立地,顶天就是指核心技术领先,可能主要是从研究院产出,怎么样更好地做好利弊这件事,怎么样去更深入地理解产品和商业模式,反过来帮助我们更好地做技术。这也跟我们今天的主题相关,怎么样能让AI变得更精彩,而不是变成泡沫。

  我们知道现在第三次浪潮已经到来,可能现在大爷大妈都知道了,(这)也许是因为前面几次浪潮低谷的教训,也许是因为现在的节奏实在是太快。在第三次浪潮之下,我们的主题一直在变。我们在2015、2016年提的是算法、算力、大数据;2017年变成什么?场景,你光有那些没有用,你得找到一个可以落地的场景。2018年变成了价值,说直白一点,是你能不能赚钱,你的技术能不能产生商业价值。所以我们可以看到,这不仅仅是哪一家公司的事情,而是整个行业的事情。

  我们认为有三种创新的模式可以引领AI的浪潮,有一些我们称为叫产品的创新和微创新,我们去关注通过一些快速的迭代,通过敏捷的开发,去关注这些用户的活跃率存活率;还有一些是在商业模式上进行创新,甚至是资本去推动的,当然这些确实能改变我们的生活,包括我们知道的所谓“中国新四大发明”,这一类型的公司,我们一般称为“冲浪型”的。

  还有一类是什么?我认为可能在现在的中国相对会少一些,我们称为源头核心技术创新。讯飞是这样一家公司,源头核心技术意味着你可能是需要坐冷板凳的,它不是一两年才能获得成果的,这种我们称为“爬山型”的公司。

  讯飞从1999年成立,从做语音合成、语音评测、识别,到2014年提出超脑计划,从“能听会说”的角度出发,也在这个过程中产生了输入法、翻译机、屏幕上的“讯飞听见”等。另外一方面,我们也在能理解、会思考这个方面,去挑战更难的认知智能。

  我们现在到底有哪些成果?在2018年初的时候,研究院院长胡国平说,讯飞在2017年“顺便”拿了七个世界冠军,今年从评测和技术角度出发,(我们)也做出了一些成绩。这里面既有我们在语音合成连续13年夺冠,也包含今年号称史上语音识别最难任务的国际CHiME-5英文识别比赛;既包含我们面向于淘宝真实照片中文字信息的OCR比赛,也包含去年我们在国际1.0版本SQuAD(Stanford Question Answering)挑战赛中,一些相关指标已经超过了人类,今年的2.0版本,我们也在此基础上获得了一个比较好的成绩。每次成绩出来的时候,我们能在朋友圈发现整齐的转发加上“666”这样一个标签,其实还是蛮壮观的。

  也有人在说,这些高大上的东西怎么样能更好地更快的在我们的业务落地,其实是一个很好的问题。

  对于源头核心技术创新,我们认为可能有几下几点(关键):

  首先核心技术要做得非常领先,甚至在世界的层面要去不断去挑战无人区;第二要能实现盈利,实现商业的闭环;第三,当你形成闭环之后,你能不能持续地、不忘初心地持续投入,这一点非常关键。在业界华为其实做得非常好,也是我们学习的一个榜样。最后很多的技术创新,它不只是某一个领域,我们怎么样去做到国际化,去拓展它的应用非常重要。

  从人工智能的技术,这些思维怎么样来助力产品创新?我们认为语音、图像这些相关的技术大致可以分为两类。第一类我们称为叫自然交互,其实很简单,你告诉一个小孩说你去打个酱油,然后把钱找回来,怎么样让机器可以更好地做这些事。

  而另一类,我们知道语言和文字产生之后,产生了很多的行业。这些行业中最宝贵的是什么?是专家,专家的知识在他们头脑里。怎么样能把这些专家的知识学习出来,把这些有限的专家资源解放出来,对行业产生更大的贡献,我们称之为智能学习。

  首先看一下交互,我们知道交互是一个发展的过程,从最初的大型机,需要专业人员通过打孔的方式和机器交互,再到后来的对系统下命令,再到我们的图形界面下的鼠标和键盘,再到以iPhone为代表的触摸方式。那么现在是一种什么方式?我们认为称为叫基于视觉呈现的语音交互。

  大家想一下,对机器来说,如果机器要把它头脑的东西展示给你用什么最方便?一定是图像,因为它有屏幕,用图片或者用文字的方式展现给你就可以了,对人来说,80%的信息是来源于视觉。如果人要把信息传递给机器,我们可以画画,我们可以写字,可以做手势,但最直接的方式还是语音,(这也是)我们现在基于视觉呈现的语音交互所要表达的思想。

  在行业能力方面,我们正处在一些主要的赛道。

声明:
1、咪哚网所转载的稿件都会明确标注作者和来源,如您不希望被转载请及时与我们联系删除。
2、咪哚网的原创文章,请转载时务必注明文章作者和"来源:咪哚网",不尊重原创的行为咪哚网或将追究责任。
标签
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:看不清?点击更换
最新评论

科技 娱乐 健康 国内 生命 天文 自然 科学

微软善于听取来自用户、IT人员和开发者的各种想法

据外媒报道,微软CEO萨蒂亚·纳德拉日前在

乐视危局 张艺谋王宝强等上亿投资或遭变故

在深陷欠款危机,贾跃亭自曝乐视资金链紧张

霜降天气渐冷 推荐4款最佳食疗

我国古代将霜降分为三候:“一候豺乃祭兽;

外媒:大陆博物馆文物众多 但最好的宝贝在台湾

新西兰stuff网站11月20日文章,原题:对首

为您推荐RECOMMEND

  • 返回
    顶部
     关于本站| 友情链接| 版权声明| 意见反馈| 不良信息举报| 联系我们| 网站导航

Copyright © 2016 咪哚网 版权所有.

MIDOO.CC, All Rights Reserved. 备案号:豫ICP备15012166号-2