如果人工智能将成为全世界的医生,则需要更好的教材!
--(文章很长,如果有兴趣可以慢慢读,我中间的部分没有翻译)
想象一下,我们来做一个简单的测试来判断你是否正发展成老年痴呆的趋势。你会看到一张图片并且描述,软件会通过你说话的方式,基于你的回答,来告诉你是否有早期老年痴呆的症状。速度很快,简单,达到90%的正确率,除了你,并不适用。
这或许由于你来自于非洲,或者印度或者中国,或者密歇根州.想象一下全世界都会越来越健康得益于新的医疗科技,但是你被远远落在后面.
事实上,这不是想象.这种现象是真实的. Winterlight 实验室, 一家来自于多伦多的初创公司, 正在建立一种基于神经系统的听力测试来用于对老年痴呆,帕金森和多发性硬化的诊断. 但是经过2016之后发布的老年痴呆的调查报告,团队遇到一个很大的绊脚石:此科技仅仅对英语发音,甚至仅仅来自于加拿大的语调.
当你和真正的医生和病患交流,突然事情变得不是那么多显而易见,对于计算机科学家数据则带来更多的证据“ Winterlight联合创始人说到. 对Winterlight来说,最主要的阻力来与于语言. 所有公司采集的数据,通过询问 安大略省得居民,通过软件的交互,全部是母语为英语的人.母语为法语的人在回答英文测试的时候,往往会短暂思考对应得英语单词,或者发音的时候对音调不是很确信. 这种短暂的,突然的发音系统的肌肉抽动则导致对疾病的错误诊断.
“如果病患会突然暂停,或者单词量不够,多数情况下意味着这符合老年痴呆的数据模型—但是同时也可能意味着你学习英语的时候已经超过了20或者30岁,” Rudzicz 说到.
类似Winterlight 实验室的人工智能诊断系统会很快的变成健康医疗的前沿力量,从实验室走出来,来帮助真实的人类来做实实在在的医疗诊断和决定.公式几乎是一样的,基于医疗的定律:采集过往病患的历史数据,然后用来预测下一位踏入诊所病人的可能发病情况.所有的有固定场所的医院都需要这种未来的诊疗系统,初创公司通过人工智能医疗健康系统仅仅在2016年就获取了超过5十亿的投资,来自于TM基金管理的分析.
数据用于训练人工智能系统是至关重要的,得以保证准确性,调查已经不止一次发现人工智能是它们学习数据的奴隶. 当人工智能被美国实施在刑事司法系统,用来预测再次犯罪率,举例来说,黑色人种的再次犯罪率预测远远超过数据基线,不管第一次的过错多么的轻微.如果数据本身是有缺陷,缺少了关键部分,或者并没有准确的反应病患的人口基数,这样基于此数据的任何算法都有带来潜在误判的巨大风险.
深度学习,是现有的人工智能系统让机器自我学习完善的算法,往往更容易受到偏见的影响. 深度学习系统工作是通过寻找数据中的相似的模式—意味着如果分析数据显示男性对应着医生,女性对应护士,算法则会将预设和偏见应用在用来回答男性女性是否是医生和护士上. 调查人士担心人工智能医疗系统同样有此问题. 考虑一下如果医生完全依靠人工智能系统来诊断皮肤癌, 或者用来决定那种药物来用于严重的病患基于生物学上标注. 类似 Google Photos,这种偏见导致失败的原型,对用户也同样带来伤害(类似把红色头发人判断为猩猩) ,但是对于医疗系统,则往往面对着生与死.
不幸的是, 对人工智能所开放的医疗数据模型以偏见和先入为主而着臭名昭著, 美国.完全不是秘密: 医疗原始数据几乎全部基于男性和白人, 而且对现实世界来带冲击. 2014研究对过往20年的癌症死亡率的发现,正是对种族多样化数据的缺失,成为了一个主要的原因导致黑色人种癌症死亡率远远大于白色人种美国人.
所多人期待人工智能将会成为下一代医疗系统的核心组成部分,包括美国食品药品监管局,已经开始批准人工智能系统帮助医生和医院对有争议的诊断来做决定. 第一步看起来前景美好: IDx,一个人工智能初创公司获得了FDA’s第一个批准的AI健康设备 (此设备用来检测糖尿病带来的眼部病变), 说到通过和政府部门合作在批准的过程中将偏见和先入为主加以考虑.
--略,参见原文 https://qz.com/1367177/if-ai-is- ... s-better-textbooks/
今天,主要的白人,白人男性的科学家正在制造基于他们自身的健康人工智能系统,才刚刚意识到需要对他们的机器的数据加以种族多样化,从而得以代表所有目标疾病的所有病患人群基线,这将是一场恶战,如果他们希望获胜的话.
一些公司也同样意识到了问题,正在采取弥补措施.举例,被Bulowami 和Gebru’s论文所广受抨击的脸部识别系统过于偏见的深度学习系统, IBM 已经公开宣布对深度学习系统的算法和数据加以调整,以求更为多样化.
与此同时,Winterlight实验室, Frank Rudzicz正在通过收集其他语言的发音和模式的大数据. 他深深的理解目前的数据远远不能解决需要解决的问题. “深度机器学习对于计算机科学家来炫耀和夸夸其谈很有用" 他说,在实践中,则需要很长的路要走!
Black Americans are more likely to die of cancer
Black Americans are more likely to die of lung cancer
https://qz.com/1367177/if-ai-is- ... s-better-textbooks/
评论
幸存者偏差
评论
人工智能越来越近似于人,自然也会继承人类的特点,根源之一是教育阶段的数据缺失导致。
评论
AlphaGo能打败李世石,学点常规知识有啥难的
评论
加一个患者种族变量即可,有什么难的。
评论
肺癌、冠心病以及各种肿瘤都是CT可以发现的。
评论
我个人的理解是患者种族的可用的数据不够多,积累的不够。所以涉及到deep learning的时候没有任何的data-set可以cover
评论
用Google翻译
评论
千万别用百度那种,肚子疼都能诊断出你快死了
评论
澳洲中文论坛热点
- 悉尼部份城铁将封闭一年,华人区受影响!只能乘巴士(组图)
- 据《逐日电讯报》报导,从明年年中开始,因为从Bankstown和Sydenham的城铁将因Metro South West革新名目而
- 联邦政客们具有多少房产?
- 据本月早些时分报导,绿党副首领、参议员Mehreen Faruqi已获准在Port Macquarie联系其房产并建造三栋投资联