斯坦福机器学习课程 第一周 (1)欢迎来到机器学习

欢迎来到机器学习

欢迎来到这门关于机器学习的免费网络课程。机器学习是近年来最激动人心的技术之一。在这门课中,你不仅可以了解机器学习的原理,更有机会进行实践操作,并且亲自运用所学的算法。在生活中,每天你都可能在不知不觉中使用了各种各样的机器学习算法。比如,当你每一次使用像诸如谷歌 (Google)或必应 (Bing) 的搜索引擎时,它们运作得如此之好的原因之一便是,由Google或微软实现的一种学习算法可以“学会”如何对网页进行排名;每当你使用脸书 (Facebook)或苹果 (Apple) 的照片处理应用时,它们都能自动识别出你朋友的照片,这也是机器学习的一种;每当你阅读电子邮件时,你的垃圾邮件过滤器帮你免受大量垃圾邮件的困扰,这也是通过一种学习算法实现的。还有一个让我兴奋的理由,是一个关于人工智能的梦想:有朝一日,我们能创造出像你我一样聪明的机器,尽管我们离这个目标仍有很长的距离,但许多的人工智能专家相信,实现这一目标最好的途径是通过学习算法,来模拟人类大脑的学习方式。关于这点,我也会在这门课程中有所提及。

在这门课中你将会掌握机器学习的前沿原理。但是,仅仅了解其中的算法和数学是不够的。尤其是如果你并不知道如何将所学的理论知识用到你的实际问题上时。因此,我们也将花费大量时间来让大家进行编程练习,帮助你实现所学的算法,并体验到它们究竟是怎么运作的。

话说,为什么机器学习在当今如此流行呢? 机器学习发源于人工智能领域 我们希望能够创造出具有智慧的机器。我们通过编程来让机器完成一些基础的工作,比如如何找到从A到B的最短路径,但在大多数情况下,我们并不知道如何显式地编写人工智能程序,来做一些更有趣的任务。比如网页搜索,标记照片和拦截垃圾邮件等。人们意识到唯一能够达成这些目标的方法,就是让机器自己学会如何去做。因而,机器学习已经发展成为计算机的一项新能力,并且与工业界和基础科学界有着紧密的联系。

身处机器学习领域。我常常会在短短一周中与形形色色的人打交道 如直升机飞行员、生物学家、还有许多计算机系统专家。比如我在斯坦福的同事们,同时平均每周我还会数次收到来自硅谷的业界人士的email,咨询我是否有兴趣将机器学习算法应用到他们所遇到的实际问题中,以上的例子都彰显了机器学习所能处理的问题范围之广。在硅谷,机器学习引导着大量的课题。如自主机器人、计算生物学等。机器学习的实例还有很多,比如数据库挖掘。机器学习变得如此流行的原因之一,便是网络和自动化算法的爆炸性增长,这意味着我们掌握了比以往多得多的数据集。举例来说,当今有数不胜数的硅谷企业,在收集有关网络点击的数据 (Clickstream Data) 并试图在这些数据上运用机器学习的算法来更好的理解和服务用户,这在硅谷已经成为了一项巨大的产业。随着电子自动化的发展,我们现在拥有了电子医疗记录,如果我们能够将这些记录转变为医学知识,那我们就能对各种疾病了解的更深入,同时,计算生物学也在电子自动化的辅助下快速发展。生物学家收集了大量有关基因序列以及DNA序列的数据,通过对其应用机器学习的算法来帮助我们跟深入地理解人类基因组,及其对我们人类的意义,几乎工程界的所有领域,都在使用机器学习算法来分析日益增长的海量数据集。有些机器应用我们并不能够通过手工编程来实现,比如说,我个人对自动直升机有着许多年的研究,想要写出一个能让直升机自主飞行的程序几乎是不可能的任务。唯一可行的解决方案就是让一台计算机能够自主地学会如何让直升机飞行。再比如手写识别,如今将大量的邮件,按地址分类寄送到全美甚至全球的代价大大降低,其中重要的理由之一便是每当你写下这样一封信时 一个机器学习的算法已经学会如何读懂你的笔迹并自动地将你的信件发往它的目的地.所以邮寄跨越上万里的信件的费用也很低。你也许曾经接触过自然语言处理和计算机视觉,事实上,这些领域都是试图通过人工智能来理解人类的语言和图像,如今大多数的自然语言处理和计算机视觉都是对机器学习的一种应用。

机器学习算法也在用户自定制化程序(self-customizing program)中有着广泛的应用,每当你使用亚马逊、Netflix或iTunes Genius的服务时,都会收到它们为你量身推荐的电影或产品。这就是通过学习算法来实现的。可以相信,这些应用都有着上千万的用户,而针对这些海量的用户编写千万个不同的程序显然是不可能的。唯一有效的解决方案就是开发出能够自我学习,定制出符合你喜好的并据此进行推荐的软件,最后,机器学习算法已经被应用于探究人类的学习方式,并试图理解人类的大脑。我们也将会了解到研究者是如何运用机器学习的工具,来一步步实现人工智能的梦想。

就在几个月前我的一位学生给我看了一篇文章,文中列举了当今12个最主要的IT技能,这些技术可以让信息技术行业的招聘官无法拒绝你。虽然这是一篇略显老旧的文章,但所有技能中最重要的便是机器学习。在斯坦福,向我咨询有没有即将毕业的研究机器学习学生的雇主,远远多于我们这儿每年毕业的机器学习的学生。因而我觉得对机器学习这一技能的需求仍有着巨大的缺口,而现在正是学习它的绝佳机会。我希望你们能在这门课中收获良多。在接下来的视频中,我将更正式地定义什么是机器学习,也会讨论机器学习主要面对的几类问题和相关算法,你也会学习一些主要的机器学习术语,并对不同的算法和其适用的场景有初步的了解。

坚持原创技术分享,您的支持将鼓励我继续创作!