-
Notifications
You must be signed in to change notification settings - Fork 12
聊聊机器学习(一)【小白向】BY 苏嘉锐
大家好,我是苏嘉锐,今天想来和大家聊聊机器学习。
P.S.:囿于个人有限的所学,以下许多可能是浅显的认识,见谅。
首先大家可能会问的第一个问题可能就是:
什么叫机器学习?
其实答案很简单:机器学习,顾名思义,让机器去学习。说到这大家可能会想到另一个词:人工智能。
是的,他们二者有着密不可分的关系,马上会说到。
人类自发明计算机以来,就一直不断地有一种想法:想让机器为我们做事,想让机器获得智能。为此,无数伟大的计算机科学家投入了卓绝的努力。
首先是1950s-1970s这段时间,最初的科学家们觉得只要能赋予机器逻辑推理能力,机器就能拥有智能。因此这段时间也被一些后人成为推理期。
在这其中最杰出的科学家要数Herbet A.Simon和Allen Newell了。就是图上的这二位。
他们最有名的作品是分别叫做“逻辑理论家(Logic Theorist)”和“通用问题求解(General Problem Solving)”的两个计算机程序。
其中前者在1952年证明了Whitehead和Russell的所著的《Principia Mathematica》书中的52条定理中的38条(并在1963年证明了全部),更为惊人的是这个程序甚至给出了一些比书上的证明更加优雅的证明方法。这个程序也被有些人称为是“第一个人工智能程序”,这两位伟大的科学家也因为他们的卓越贡献在1975年获得了图灵奖。
然后来到了1970s,人们觉得机器光有逻辑推理能力还不够,得有知识才行啊,正所谓
知识就是力量。 ——培根
于是科学家们开始努力地想办法让机器获得知识。这个年代最杰出的科学家当属E.A.Feigenbaum了,
他的主张是知识工程,他本人也被人称为是“知识工程”之父。知识工程是干嘛呢?大概想法就是人们把自己已经有的知识教给机器,这样机器不就有知识了吗?(由于他的卓越贡献,他本人在1994年也获得了图灵奖)
再后来,科学家们觉得这样还是不行,知识那么多,一点一点教给机器得教到哪辈子去,也太累人了。于是,就有了机器学习这个主张,意思大概就是“我们懒得教,你自己学吧”。但其实这个词也并非是后来才提出来的,早在50年代图灵提出人工智能的时候,他就提了这个词,但当时没有收到重视。后来人们才发现,这才是正确的道路。换言之,机器学习是实现人工智能的必由之路。
于是此后至今的这些年,无数人前赴后继,在机器学习领域不断地探索创新,才有了今天的样子。
2006年,CMU宣布成立机器学习系,这也是世界上第一个为机器学习专门成立系的大学。
那么,到底什么是机器学习呢?
机器学习是一门以计算机为工具和平台,以数据为研究对象,以学习方法为中心;是概率论、线性代数、数值计算、信息论、最优化理论和计算机科学等多个领域的交叉学科。
同时,它也是当今大数据时代的一项核心技术。我们收集数据,储存数据,传输数据,管理数据,这些都只是为了更好地利用数据。
在机器学习领域比较公认的定义是在1998年由Tom Mitchell(他也是CMU机器学习系的第一位系主任)在著作中提出的:
A computer program is said to learn from experience E with respect to some task T and some performance measure P if its performance on T, as measured by P, improves with experience E.
什么意思呢?
给机器一个任务,再给它一些经验,找到一个可以衡量任务表现的尺度。如果通过经验,它的表现能不断提高,那么我们就说,机器学习了。
其实也很好理解,完全可以类比于我们在学校的学习,我们的任务是学到知识,经验就是老师的讲解和做过的习题,衡量学到知识表现的尺度就是考试成绩,如果好好听讲,好好做题,我们的考试成绩越来越好,说明我们学习了。
同样的道理还适用于我们人类做的许多许多许多事情。我们人类的很多学习(不限于知识学习)其实都依赖于经验。所以经验其实对于一个人来说非常重要。
刚才说到机器学习研究的对象是数据,其实数据之于机器,就是经验。经验对于我们人类多重要,数据就对机器有多重要。
那么机器学习具体能干嘛呢?
包括但不限于以下:
- 数据挖掘
- 计算机视觉
- 自然语言处理
- 生物特征识别
- 搜索引擎
- 医学诊断
- 检测信用卡欺诈
- 证券市场分析
- DNA序列测序
- 语音和手写识别
- 战略游戏
- 机器人
- ……
说技术大家可能有些陌生,但是说到运用了这些技术的产品大家可能就熟悉了:Siri, 各种搜索引擎, Face U,Google翻译, 自动驾驶,等等等等。
以及在Youtube上,如果源视频没有字幕,网站提供了自动匹配字幕的功能,准确性也还挺不错的,这同样运用到了机器学习技术。
总之,用处还是蛮广的。
这次先写到这吧。下次给大家说说一些具体的栗子。至于什么时候会更,我也不知道。
本文历史故事部分参考自周志华所著《机器学习》(好书啊),图片来自网络。
@ 计算机爱好者联盟