本文作者:GrgoryPiattsky,KDnuggts.

我对有着“摇滚明星”美誉的数据科学家杰里米·霍华德进行了独家采访,他谈到了自己最新出品的深度学习网络课程,Kaggl因何获得行业领先地位,以及数据科学家的价值所在。

杰里米·霍华德(

jrmyphoward),是数据科学领域的“摇滚明星”。他在年少时成绩出色,还在澳大利亚读书时就多次获得考试最高分,但他觉得在学校里很无聊。于是他在12岁时开始“创业”,销售盗版游戏软件,18岁时作为一名自学成才的数据分析师被麦肯锡雇用。几年后,他创立了OptimalDcisionGroup,利用数据分析来帮助保险公司提高利润。

相比之下,他的第二家创业公司FastMail更为流行和被人熟知。年底,他卖掉了这两家公司,开始了简单的“退休”生活——学习中文和自己动手制作音响功放。

为了寻找挑战,年,他参加了Kaggl举办的一场比赛,并且一鸣惊人得获得第一名。之后他被邀请加入Kaggl担任总裁兼首席科学科学家,帮助Kaggl一步步占据行业领先地位。

年12月他离开Kaggl后,又创建了一家公司Enlitic,通过利用DpLarning来改进医学诊断和临床决策。笔者是在KDD-会议上首次结识了杰里米,那次大会上,他就深度学习做了一场令人难忘的演讲。他没有使用任何幻灯片,仅仅是用一支马克笔不断在白板上写写画画,深入浅出得解释他的想法和认识。fast.ai是杰里米最新的创业公司,关于这家公司的细节你可以从下文中找到答案。

Q1.GrgoryPiattsky(下面简称GP):跟我们谈谈你目前的这家创业公司fast.ai?你的《DpLarningforCodrs》课程与其他深度学习课程有什么不同?

杰里米·霍华德(JrmyHoward,下面简称JH):网上有许多深入学习课程,但是没有一任何个满足我们最重要的需求。我们希望向人们展示如何选择和使用最有效的深入学习技术来解决实际问题。而且我们希望它尽可能得深入浅出,特别是易于没有任何经验的程序员理解和掌握。以前的教学方法是和数学领域高度相关的,无法直接解决任何问题,比如Udacity上的编程问题。根据对许多深入学习项目或课程的分析,我们意识到最重要的教学方式是传授学习(transfrlarning),这是指使用已经在大型数据集上训练过的模型,作为起点或基线。这样可以将训练时间加快若干个数量级,提供更准确的模型,并且不需要依太多数据。我们也致力于只教授那些从真实的实际问题中获得的研究成果。听说很多学习过我们MOOC课程的人已经获益匪浅:大大提高了他们模型的准确度和训练速度!

Q2.GP:在创立fast.ai之前,年你创建了Enlitic,其目标是使用深入学习,帮助医生更快更准确地做出诊断。相比其他受过专业医学教育的医生,(利用Enlitic)到底能获得多大帮助和提升?

JH:我不清楚目前最新的进展,毕竟我已经离开几个月了。但是,在我学习深度学习如何应用于医学方面的时候,我发现这方面的机会和潜力十分巨大。最重要的是,通过这项技术得应用,它有机会挽救生命,显著降低医疗费用,特别是在那些发展中国家。

在临床实验中,Enlitic帮助四名业界顶级的放射科医生,多发现并确诊7%的癌症;在广泛病例诊断中,医生错诊率为66%,而Enlitic则为47%。——SydnyMorningHraldRports

Q3.GP:在医疗健康行业中广泛采用Enlitic或类似的自动化技术有哪些障碍?

JH:最大的障碍之一是缺乏综合全面的数据集。即包含了很长时间周期内的医学测试、干预措施和治疗结果的历史的数据集,并将所有的患者联系起来。只有通过这样的数据集,才可以构建基于实际治疗结果进行诊断检测和治疗建议的有效模型。另一个障碍是缺少研究这一领域的数据科学家。在互联网行业,你能看到很多聪明、有能力的人从事于那些“影响力”很小的事情上,比如广告系统,推荐系统和浪费时间的社交网络。这是令我很惊讶的。

此外,在学术界很多深入学习的研究人员又都专注于“如何构建一个大脑”,而不是解决当前人类面对的各种重要问题。另一个特别的障碍是,医学从业者,特别是临床专家们,他们知识领域具有非常高的专业性,以至于很难找到其他人可以在“解决医学问题”上为我们提供教学建议的人。

Q4.GP:你以Kaggl竞赛第一名而获得广泛







































白癜风治疗哪里好
北京治白癜风的儿童医院



转载请注明地址:http://www.yingxianglia.com/ppyxl/277.html