发布时间: 2017-04-27 14:07:52 点击量:
17秒内阅读3469本医学专著、248000篇论文、69种治疗方案……并提出三个最优选治疗方案。
德国汉诺威消费电子、信息及通信博览会上,IBM和软银合作推出的Watson版人工智能机器人Pepper与参观者对话。 图/CFP
AI可以帮人类更好地治愈疾病吗?
2016年8月,一名60多岁的日本患者突然身体不适,被紧急送到日本东京大学医学研究院。经过多次化验与检测,医生诊断,他患上了急性骨髓性白血病。
然而,对症治疗几个月后,病情没有缓解,病人的情况继续恶化,甚至渐渐丧失了意识。
IBM的医疗人工智能Watson(沃森)被请来帮忙。“研读”患者所有的医疗资料10分钟后,Watson给出它的结论:患者的确患上了白血病,但不是急性骨髓性白血病,而是另一种罕见的白血病。
这是IBM大中华区总裁陈黎明在公开场合常讲的一个故事。Watson是IBM推出的认知型人工智能。所谓认知,即它可以自主地学习输入给它的大量数据,包括论文、专著等知识型数据,以及图片、视频等影像数据;所谓人工智能,则是它可以自主地根据所学习到的数据,与现实情况进行比对,进而做出决策。“Watson是为商业而生的人工智能平台,它能够改变我们的职业和行业。”陈黎明说。
代替医生,还是成为医生助手?
由计算机辅助医生进行医学诊段,并不是一件新鲜事。心电图就是通过计算机识别出心脏传递出的信号,变成显示在纸张或电脑屏幕上的一排连续的、变化的线条。X射线透视技术、CT、B超等技术也同样有计算机的参与。计算机完成检测,并将人体运转的生物学信号,转变成可视的、单纯的线条、符号或影像,作为医生诊断的依据。
但这样的诊断并没有自主学习的机制。一台检测过3000位病人的计算机,并不比只检测过30位病人的计算机更聪明。它们只是依据事先输入的程序运转。
人工智能最大的不同,在于它运转的规则不是事先输入的程序,而是依托庞大的后台数据库,根据正在检测的病人情况,“思考”出针对每一个病人的单独的结论。在人工智能领域,这被称为“深度学习”。
与普通的医生学习相比,计算机的深度学习具有强大的优势。培养一名医生,需要4年的本科学习,3年的研究生训练,以及从实习医生、住院医生到门诊医生的大量医学实践。培养一名优秀的医生,至少需要十年时间。
而一旦计算机的“深度学习”网络建成,它便可在短时间内,自主阅读所输入给它的大量医学论文及病例,且夜以继日,不眠不休。
以Watson为例,它可以在17秒时间内阅读3469本医学专著、248000篇论文、69种治疗方案、61540次实验数据以及106000份临床报告,并最终提出三个最优选的治疗方案。而一名医疗人员,平均每年最多只能阅读200至300份医疗文献著作。
Watson的认知计算有着比深度学习更广阔的外延,陈黎明解释说:认知计算能够实现大规模学习、针对问题的推理和思考,进行自然语言交互,增强和扩充人类在专业知识方面的学习能力,与人类合作解决人类和机器无法单独解决的问题。认知创新代表了信息技术未来的发展方向,是开启商业和社会发展新时代的钥匙。
不过,IBM并不打算用Watson取代人类医生。它只负责给出建议,最终的决策,仍需要医生负责。
“人工智能的概念是增强人类的智能。”IBM公司董事长、总裁及CEO 罗睿兰解释说,正如蒸汽机增强了人类的体力,电话增强了人类的通话能力,计算机增强了人类的计算能力,“机器的协助并没有取代人类的活动,它只是扩展了人的技能和专业水平。”
IBM认知物联网驱动的超级赛车,通过Watson IoT平台和其他工具来操控赛车,防止赛道碰撞,实现轻松驾驶。图/受访者供图
“训练”Watson
将Watson训练成一个医疗专家,花了整整12年。
2005年,IBM研究院意识到,十年之后,医疗和机器学习的结合将会成为重要的研究领域。他们从心血管疾病和乳腺疾病的医疗影像识别开始做起,后来聚焦在癌症的诊断上。
据统计,2015 年全球新增的癌症病例为1410 万,死于癌症的人数高达820 万人。由于环境恶化、寿命延长等因素,预计未来20 年,全球内新发病例的增加幅度将高达70%。
计算机曾以显示影像、符号等方式,对医疗服务给予帮助,但要真正成为给出诊断的医生,它首先需要学习的是如何阅读这些影像。
试想一下,一名医学院的学生是如何学习理解这些医学影像的:他们先从书本或教材中获得病症的特征,然后在不断的实践中,将这些知识与现实情况加以对应。遇上疑难问题,他们依靠老师、前辈和医学病例,反复对比和讨论,直至得出结论。
但计算机的理解方式完全不同。它不会因为有人告诉它“这是一只猫”,就在遇到下一张相同或类似影像时,立该意识“这也是一只猫”。它的理解方式是机械的。它首先需要大量阅读同一类型的影像,从中提取出同质的特征,记忆、保存,直至它可以在遇到同类影像时,立刻做出识别。
但深度学习或者认知计算最大的不同,是计算机有能力自主地处理这一过程。人们需要做的,只是输入数以百万计的分类过的影像信息,然后等待它宣告学习完成。放在人类社会中,它就是一名优等生,无须老师和家长的督促,也能自觉、快速地完成所布置的作业。错误自然也会出现,但在一次次类似“考试”的检测之后,准确率便会随之提高。
为了训练和培养Watson在癌症诊断方面的能力,IBM与美国纪念斯隆-凯特琳癌症中心合作,为Watson提供了最前沿的教材:医院100多年来的癌症临床治疗方面的实践经验,以及基于美国国立综合癌症网络而编制的治疗指南。此外,还有美国44家医疗机构的历史癌症治疗案例。
Watson的主攻方向包括:肺癌、乳腺癌、胃癌、结肠癌、直肠癌、子宫颈癌等高发癌症。“培训”12年后,它已掌握了超过 290 种医学专业期刊的全部内容,超过200本肿瘤专著,超过1500万页的论文数据,还有字典、百科全书、新闻、文学以及其他可以建立知识库的参考材料。
但“培养”一名机器医生也不是一帆风顺的。2011年时,Watson的医学知识水平还与医学院二级学生的水平相当。3年后,Watson的疾病诊断率达到73%。
2017年,为检验Watson的诊断水平,北卡罗来纳大学教堂山分校的耐德·沙普利斯博士研究了1000余名患者的数据,发现在99%的病例中,Watson提出了与分子肿瘤专家团相同的治疗建议。IBM旗下沃森健康(Watson Health)副总裁史蒂夫·哈维(Steve Harvey)先生介绍说,在30%的案例中,Watson还发现了癌症专家错过的一些细节。
弥补资源不均的局限
帕姆66岁,患转移性膀胱癌8年,尝试过许多不同的疗法,一直没有痊愈。她已经没有什么选择了。
医生提出用Watson来帮忙,试图去发现诊断中的一些医生可能会忽略的东西。对于帕姆来说,也许,机器人医生能带来奇迹。
Watson看了上万张肿瘤扫描的图像,它们来自不同的病人。最后,在帕姆的肿瘤扫描片中,Watson标出了一段突变的基因。这是医生之前没有发现的。他们根据这个发现制订了新的诊疗方案。
如今,这套使用在帕姆身上的方案已经引入中国。中国是癌症发病和死亡大国。全国肿瘤登记中心统计显示,2015 年中国因癌症死亡的病例超过200万例,新增400余万例,平均下来,每天的新增癌症诊断病例约有1.2万例。
“中国医疗健康领域面临的一个突出挑战是,优质健康医疗资源配置不均,除了要在政策和体制上想办法之外,我们更要向科技创新要解决方案。”陈黎明算了下,“一个好的医生的培养需要25到30年左右,但选择工作时,他会首先选择去大城市的三甲医院工作,老少边穷地区的医疗问题依然不能得到解决。”
中国试图用远程医疗来解决问题,然而远距离诊断、治疗和咨询同样会受到资源不足的限制,一个医生一次只能面对一个病人。Watson的存在,或许能够弥补这种局限。未来的Watson医生,将会成为这样一套通用系统:看得懂医学检验报告、医学图像资料,还能够读懂基因图谱,甚至可以将当地生活环境和场景结合到对患者的诊疗过程中,最后给出一个或者多个诊疗建议。更妙的是,培养每一位医生,都需要从零开始,但Watson能够在不断学习中不断分身,同时学习和关注多种疾病。
Watson并不是IBM在认知计算方面与中国的唯一合作领域。2016年年初,罗睿兰在一次演讲中提出,IBM将转型为“认知计算解决方案与云平台公司”,自此,“认知计算”被提升到一个新的战略高度,成为IBM市场战略中最重要的关键词。这也是Watson进军中国最重要的背景。
2014年,IBM开始与北京市政府合作实施“绿色地平线”计划。这是一项利用人工智能对大数据的分析和学习能力,对空气质量进行分析与预测的计划。在计算机的辅助下,北京实现了提前72小时逐时高精度空气质量预报,还将空气质量变化趋势预测分析的最长期限提高到10日。人类可以提前了解空气污染的演变过程及影响,从而作出应对措施。
IBM工作人员在向参观者讲解绿色地平线计划。 图/受访者供图
类似的技术甚至可以应用在时尚界。Watson曾与设计师张卉山合作,为李宇春设计了中国第一套“认知礼服”。这套礼服或许是中国时尚界最具科技含量的时装了。Watson 分析了李宇春2013年以来每次出镜的形象,同时阅读了她全部的微博和上百万条粉丝评论,最终建立了一个李宇春的“时尚形象”与粉丝及公众评论之间的关联模型,为设计师总结出来一整套“李宇春的时尚特质”。设计师确定设计方向后,Watson浏览了30万张图片,根据设计师的构思,从廓形、面料、颜色等方面分析,从中挑选了3000幅礼服图片供设计师参考。
整个设计周期,只用了一个星期。
数据开放的难点
据IBM的预测,到2020年,全球每人每天产生的数据约为2.4GB。形象点说,每人每月生产的数据可以填满一部64GiPhone手机。这其中,不再是以数字、符号类易于读取的结构化数据为主,大量是图像、视频等难以被量化、没有固定的长度和格式的非结构化数据。根据IBM的预测,2017年的非结构化数据将占到数据总量的80%。以2015年全球智能手机用户20亿人计算,如此巨大的数据,对于人工智能的计算能力是非常大的考验。
许多企业也在预测到这种前景后谋求转型升级。IBM与万达的合作就是一个证明。从房地产转型全面消费领域的万达公司,打算快速把万达所有产业与互联网技术融合,带动所有产业快速发展。万达希望通过与IBM的合作实现互联网化运营,同时优化升级实体商业供应链,并对大型商业中心的基础设施做智能化联接。
比如,在购物中心层面,利用Watson的认知计算能力,未来店面或许会遍布视觉传感器、客流分析系统等技术,可以实时输出特定人群预警、定向营销及服务建议、实时货品调整提醒、以及用户行为及消费分析报告。
而在餐饮行业,智能排队等位系统、室内找位导航系统,以及消费者用餐喜好推荐系统,都将根据Watson获得的数据得到优化,进而提供更高效的服务。“万达将成为Watson在中国落地的重要的基础设施。”陈黎明说。
并非一切都如此乐观。大数据是人工智能与各领域契合的原料,也是人工智能前进的动力,然而是否将所有数据开放,是一个敏感话题。
“各个国家都存在数据孤岛的问题,如何让数据依法有序合规地开放,是行业治理命题。要想人工智能在特定的场景下发挥作用,仅靠IBM是做不了的。”陈黎明说。
收购相关数据公司是一个不错的选择。2015年4月,IBM宣布设立沃森健康(Watson Health)部门,同时收购了医疗分析公司Explorys与医疗管理软件公司Phytel,以增强Watson在医疗领域的分析能力。
这年8月,IBM又以10亿美元收购了医疗成像软件公司Merge Healthcare,为Watson提供了海量的医疗图像数据。如今Watson能够识别许多病症,与这笔收购获得的数据有密不可分的关系。
陈黎明曾对媒体如此表示:“很多领域IBM的产品并不适合中国国情,但我想不去交流、不去沟通,永远不知道可不可行,通过交流、互动,也许可以找到一些可行的方案。”
数据的开放与共享可以为人工智能带来意想不到的发展。回到医学领域,或许可以试想这样一个世界——手机将通过分析我们的通话状态诊断是否患有阿尔茨海默病;浴缸将通过扫描对内脏的健康状况作出评估;方向盘可以通过驾驶中的微小行为断定司机是否有帕金森症;只要照一下镜子,就可以了解自己的皮肤状况。
抵达这个愿景的路程固然漫长,但我们毕竟已经踏上了起点。
上一篇 下一篇