巴蜀网

 找回密码
 免费注册

QQ登录

只需一步,快速开始

开启左侧
查看: 234|回复: 0
 上官123 发表于: 2018-1-14 09:35:00|显示全部楼层|阅读模式

[2018年] 腾讯俞栋:腾讯AI Lab的目标是Make AI everywhere

 [复制链接]
Ji0--fyqnicm0449137.png
腾讯AI Lab副主任、杰出科学家俞栋
  1月11日下午消息,在在腾讯众创空间CES之夜中,腾讯AI Lab副主任、杰出科学家俞栋介绍了腾讯AI Lab的战略布局及最新进展。
  “在腾讯,我们的AI战略是AI in ALL,我们想把AI用在所有的应用场景中,并通过‘基础研究──场景共建──AI开放’三层架构推进AI战略的实施。”
  最近几年,AI已成为全球热词,俞栋认为主要有两方面原因:“一方面原因在于人工智能的技术得到了飞速的发展,另外一方面是因为我们看到在越来越多的场景里人工智能确实能够提升我们的生产力。比如,日常生活中的人机交互场景、真实物理世界中的需要自主决策和自主控制的应用场景,以及工业领域里机械性的、重复性的工作场景,都可以通过AI大大提升效率。”
  就腾讯而言,AI已经有了较为广泛的应用,这些应用增进了用户体验。据俞栋介绍,腾讯 AI Lab在研究层面,重点关注机器学习的基础理论研究、计算机视觉、语音识别以及自然语言处理四个方向。在应用领域,结合腾讯的业务重点发展游戏AI、社交AI、内容AI和平台型AI。
  俞栋在当天的演讲中着重介绍了腾讯 AI Lab的最新进展:“腾讯 AI Lab的目标是Make AI everywhere,也就是AI in All的另外一种表述。”
  在游戏AI方面,俞栋表示:“我们不仅研究棋类游戏AI,同时也做智能体和人工环境交互情境下的一些游戏AI研究。因为游戏也是一个训练AI与环境交互,AI与人交互和博弈的重要途径,通过研究游戏AI,我们可以研究如何实现真正的通用AI。”俞栋还介绍了腾讯在社交AI、内容AI中的最新进展。
  据他介绍,腾讯的社交AI通过提升用户与用户之间交互的体验,来增加人与人交互的便利性,同时提供更多人与人的交互方式。通俗讲,就是通过技术手段,使得人与人之间的交互变得便利。比如有些人只懂某种语言,社交AI可以通过语言之间的翻译,让大家能够听懂并交流。
  内容AI不仅能理解文本信息,也能理解图像和视频信息。比如,给系统一些图,它可以根据图片生成歌词并唱出来。再如,让AI通过跟踪人的肢体动作来判断对某些要求的动作、规范是否做得到位,可以产生一些更有趣的体验。此外,内容AI还可以做个性化的推荐。以文本推荐为例,AI利用文本本身的信息(比如新闻的信息)、阅读人的信息和当时的环境,还包括他的朋友的信息,我们可以做到比较精准的推荐。
  近年,AI+医疗已成为很重要的AI应用场景。俞栋表示,腾讯AI Lab 也做了很多尝试,尤其是在医疗影像和AI辅助诊疗方面,腾讯觅影可以非常准确地识别食道癌和肺癌病灶。在AI辅助诊疗方面,通过分析医学论文和医疗记录等,可以更好地了解某种疾病有些什么病症,发展下去有什么样的变化,在不同的疗法下会有什么样的结果,然后半自动地构建一个知识库。“利用这样的知识库,我们就可以做辅助诊断,不仅能够加快诊疗并且能让诊疗变得更准确。”俞栋表示。
  “AI的发展是一个系统工程,不是一家公司或者几家公司可以独立发展的,我们的AI战略还包括AI开放,即平台型AI。”据俞栋介绍,在场景共建层面,腾讯AI Lab通过AI开放战略赋能合作伙伴,助力AI技术在更多场景的应用转化。
  据了解,作为AI开放战略的载体,腾讯AI开放平台汇聚了行业顶尖的AI技术能力、专业人才和产业资源,并依托腾讯AI Lab、优图实验室、WeChat AI等团队的技术能力以及腾讯云的计算能力,升级锻造创业项目。该平台已开放超过60个API接口,为合作伙伴提供自然语言处理、计算机视觉、语音识别能力等技术支持,全方位扶持创业者的发展。
  而作为腾讯AI开放平台与合作伙伴桥梁的腾讯AI加速器,也在当天宣布面向全球招募第二期学员。AI加速器将重点聚焦零售、医疗、翻译、硬件、内容等领域,招募全球范围内拥有独特的技术能力,或拥有垂直的行业资源,或拥有独特行业解决方案的天使-B轮的创业公司。腾讯AI加速器将通过提供技术、资源、导师、市场、投资等五大层面的扶持助力AI创业者,帮助入驻企业在AI技术及产品寻找到更多的应用场景,促进AI技术在各行各业的落地应用,与合作伙伴一起实现AI in ALL。(宵寒)

以下为俞栋演讲全文
  今天,我要介绍的是腾讯的AI策略和已取得的一些进展。因为我的幻灯片用了英语,我将用中文演讲,以照顾在场大多数说中文的听众。
  大家可能都知道,在最近的几年里,人工智能变成了一个非常热的词。一方面原因在于人工智能的技术得到了飞速的发展,另外一方面是因为我们看到在很多场景里人工智能确实能够提升我们的生产力。比较常见的几个场景,一个是对话系统,比如说在CES里大家也能够看到有很多的智能音箱以及智能机器人和车,主打人跟机器或者人跟车交互这样的应用。
  第二个比较常见的是人工智能技术在真实物理世界中的应用,这会涉及一些,比如说自主决策和自主控制这样一类的技术。
  第三类是在已有的一些工业场景里面,之前因为缺少一些技术使得它不够智能化,有很多工作需要人工去做,但现在由于人工智能技术的发展,使得很多机械性的、重复性的工作,或者需要从大数据中发现复杂关系的工作,可以由机器来代替了。
  人工智能技术在腾讯目前主要起到赋能的作用。它使得在很多场景里,体验能够做得比原来更好。所以在腾讯,我们的AI战略,叫做AI in All,就是在所有的场景里面,我们都想把人工智能技术用在里面。从组织架构来讲,我们也建立了若干与人工智能相关的实验室;并且在很多不同的产品团队里面,有很多熟悉人工智能技术的工程师。在这些配置里面,其中一个很重要的组织就是腾讯的人工智能实验室,即腾讯 AI Lab。我今天主要介绍在腾讯 AI Lab的一些进展。
  腾讯 AI Lab有一个比较重要的目标,就是Make AI everywhere。其实也就是AI in All的另外一种讲法。
  在研究层面,我们比较关注四个方向。一个是机器学习的基础理论,一个是计算机视觉,一个是语音识别,还有一个是自然语言处理。
  在应用层面,我们有三个重点方向,就是游戏AI、社交AI、和内容AI。我们选择这三个重点方向主要因为它们和腾讯的业务比较契合。
  游戏AI,主要是通过人工智能的技术,使得游戏的设计和玩家的体验都能得到提升。大家可能知道,腾讯游戏在整个世界范围都处于领先的地位,所以游戏AI有很多的应用场景。
  第二个是社交AI,它的目标就是要通过使用AI技术来更好地提升人跟人,人跟机器的交互。这也是因为腾讯有两大主要的社交网络,一个是微信,一个是QQ。
  另外一个就是内容AI,我们希望通过理解内容来更好理解用户,来给不同的用户提供不同的、个性化的服务。
  在游戏AI领域,我们最早做的是棋类游戏,比如腾讯的绝艺,就是我们研发的围棋AI。在之前机器围棋国际性顶尖比赛UEC杯中,绝艺11连胜得到了冠军。
  但是我们的游戏AI研究并没有止步在这里,因为我们觉得游戏AI不仅仅可以提升游戏的能力和玩家的体验,同时它也是一个非常好的研究人工智能技术的环境,是一个研究智能体怎么和环境、怎么和人交互和博弈的一个场景,所以我们能够通过研究游戏AI,来慢慢地研究如何实现真正的,我们叫做通用人工智能的技术。所以在这方面,我们就不单单只是做围棋AI,我们同时也做智能体和人工环境交互情境下的一些游戏AI研究。
  在社交AI领域,我们通过技术实现人跟人交互的更新的更有效的方法,以此提升人跟人交互的便利性和体验。
  举个例子,就是通过技术手段,使得人跟人之间交互变得更容易。比如说有些人,他只懂某种语言,但我们可以通过语言之间的翻译,使得大家能够互相听懂。
  我现在播放的是一个在今天来说比较常见的同声翻译的demo(演示),很多公司现在都有这个能力。通过结合语音识别技术和机器翻译技术,我们可以打破语言障碍,使人和人之间的交互变得更容易。
  在内容AI领域,我们不但要理解文本信息,也要理解图像和视频的信息。这样,我们一方面能够更好地理解内容本身,同时通过理解内容,也可以更好地理解用户,给用户提供更好的推荐。另外,我们也通过理解内容,反过来可以生成内容,这是更难的一步。
  举两个例子。一个是通过建立图像跟自然语言之间的联系,我们可以做很多事情。比如在照片下面我们可以自动加上标注,或者可以通过给定一张照片,找到其他类似的照片。另外,你也可以提供照片或者video,让系统做其他事情。这里的demo(演示)就是看图唱歌,就是给一些图,它可以根据图片生成歌词并唱出来。下面是demo(演示)。
  这就是一个简单的例子,结合图像识别和理解技术以及语音合成技术。当然这里不是一般的语音合成,它涉及韵律,是更类似音乐合成的技术。我们可以看到,把不同技术衔接起来,可以产生一些人跟人之间交互的更友好的手段。
  另外一个例子,就是通过计算机视觉技术能够跟踪人的姿态变化。然后,产生一些更有趣的体验。我们也可以放一个demo(演示)。
  右边的demo(演示)就是通过跟踪人的肢体动作来判断对某些要求的动作、规范是否做得到位。
  另一方面,通过内容AI,我们可以做个性化的推荐。这里是文本推荐,就是我们利用文本本身的信息,即新闻的信息、阅读人的信息和当时的环境,还包括他的朋友的信息,我们可以做到比较精准的推荐。
  当然,在最近的几年里面,还有个很重要的人工智能应用场景,就是AI+医疗。AI Lab 也做了很多尝试,尤其是医疗影像和AI辅助诊疗上面,我们可以做到非常准确地识别食道癌和肺癌病灶。即便给定的训练样本只告诉系统有还是没有癌症,但没有标注在什么地方有,我们的技术也能自动地判断在什么位置有病变。这个比原有的技术有很大的提升。
  另外,我们也在研究AI辅助诊疗,通过分析文本,包括分析医学论文和医疗记录,可以更好地了解某种疾病有些什么病症,发展下去有什么样的变化,在不同的treatment(疗法)下会有什么样的结果,然后半自动地构建一个知识库。利用这样的知识库,我们就可以做辅助诊断,不仅能够加快诊疗并且能让诊疗变得更准确。
  我们把许多基本的人工智能技术和能力包装起来变成API和SDK,以便大家使用。这些能力包括语音识别、合成、翻译、情感识别、文本分析和理解、物体识别,也包括闲聊等,然后放在开放平台上。有两个渠道大家可以使用我们提供的能力,一个是AI.qq.com,另一个就是腾讯AI加速器。谢谢大家。
『 巴蜀网 』提醒,在使用本论坛之前您必须仔细阅读并同意下列条款:
  1. 遵守《全国人大常委会关于维护互联网安全的决定》及中华人民共和国其他各项有关法律法规,并遵守您在会员注册时已同意的《『 巴蜀网 』管理办法》;
  2. 严禁发表危害国家安全、破坏民族团结、破坏国家宗教政策、破坏社会稳定、侮辱、诽谤、教唆、淫秽等内容;
  3. 本帖子由 上官123 发表,享有版权和著作权(转帖除外),如需转载或引用本帖子中的图片和文字等内容时,必须事前征得 上官123 的书面同意;
  4. 本帖子由 上官123 发表,仅代表用户本人所为和观点,与『 巴蜀网 』的立场无关,上官123 承担一切因您的行为而直接或间接导致的民事或刑事法律责任。
  5. 本帖子由 上官123 发表,帖子内容(可能)转载自其它媒体,但并不代表『 巴蜀网 』赞同其观点和对其真实性负责。
  6. 本帖子由 上官123 发表,如违规、或侵犯到任何版权问题,请立即举报,本论坛将及时删除并致歉。
  7. 『 巴蜀网 』管理员和版主有权不事先通知发帖者而删除其所发的帖子。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

© 2002-2024, 蜀ICP备12031014号, Powered by 5Panda
GMT+8, 2024-3-29 20:33, Processed in 0.140400 second(s), 11 queries, Gzip On, MemCache On
快速回复 返回顶部 返回列表