我们普通的教师是否也在教研?如果我们要在教学中不断成长,不断进步,就必须将教研进行到底。所以,我们千万要有一种自信:在教研行为中,我们不仅是被研究者和被培训者,我们还是教研的主人,教研的行者。......
2023-11-16
关于算法的重要性,李开复(图3.38)有一篇精彩的文章,题目是“算法的力量”。李开复是一位信息产业公司的执行官和计算机科学的研究学者,1998年加盟微软公司,随后创立了微软中国研究院(现微软亚洲研究院)。2005年7月加入Google(谷歌)公司并担任Google全球副总裁兼中国区总裁一职。2009年9月李开复宣布离职并创办创新工场,任董事长兼首席执行官。以下内容摘自李开复《算法的力量》这篇文章。
算法是计算机科学领域最重要的基石之一,但却受到了国内一些程序员的冷落。许多学生看到一些公司在招聘时要求的编程语言五花八门就产生了一种误解,认为学计算机就是学各种编程语言,或者认为,学习最新的语言、技术、标准就是最好的铺路方法。其实大家都被这些公司误导了。编程语言虽然该学,但是学习计算机算法和理论更重要,因为计算机语言和开发平台日新月异,但万变不离其宗的是那些算法和理论,例如数据结构、算法、编译原理、计算机体系结构、关系型数据库原理等。在开复学生网上,有位同学生动地把这些基础课程比拟为“内功”,把新的语言、技术、标准比拟为“外功”。整天赶时髦的人最后只懂得招式,没有功力,是不可能成为高手的。
图3.38 创新工场董事长兼CEO李开复
·算法与我
记得我读博时写的Othello对弈软件获得了世界冠军。当时,得第二名的人认为我是靠侥幸才打赢他,不服气地问我的程序平均每秒能搜索多少步棋,当他发现我的软件在搜索效率上比他快60多倍时,才彻底服输。为什么在同样的机器上,我可以多做60倍的工作呢?这是因为我用了一个最新的算法,能够把一个指数函数转换成四个近似的表,只要用常数时间就可得到近似的答案。在这个例子中,是否用对算法才是能否赢得世界冠军的关键。
·网络时代的算法
有人也许会说:“今天计算机这么快,算法还重要吗?”其实永远不会有太快的计算机,因为我们总会想出新的应用。虽然在摩尔定律的作用下,计算机的计算能力每年都在飞快增长,价格也在不断下降。可我们不要忘记,需要处理的信息量更是呈指数级增长。现在每人每天都会创造出大量数据(照片、视频、语音、文本等等)。日益先进的记录和存储手段使我们每个人的信息量都在爆炸式增长。互联网的信息流量和日志容量也在飞快增长。在科学研究方面,随着研究手段的进步,数据量更是达到了前所未有的程度。无论是三维图形、海量数据处理还是机器学习、语音识别,都需要极大的计算量。在网络时代,越来越多的挑战需要靠卓越的算法来解决。
·并行算法:Google的核心优势(www.chuimin.cn)
每天Google的网站要处理十亿个以上的搜索,Gmail要储存几千万用户的2G邮箱,Google Earth要让数十万用户同时在整个地球上遨游,并将合适的图片经过互联网提交给每个用户。如果没有好的算法,这些应用都无法成为现实。在这些应用中,哪怕是最基本的问题都会给传统的计算带来很大的挑战。例如,每天都有十亿以上的用户访问Google的网站,使用Google的服务,也产生很多很多的日志(Log)。因为Log每分每秒都在飞速增加,我们必须有聪明的办法来进行处理。我曾经在面试中问过关于如何对Log进行一些分析处理的问题,有很多面试者的回答虽然在逻辑上正确,但是实际应用中是几乎不可行的。按照他们的算法,即便用上几万台机器,我们的处理速度都跟不上数据产生的速度。
那么Google是如何解决这些问题的?
首先,在网络时代,就算有最好的算法,也要能在并行计算的环境下执行。在Google的数据中心,我们使用的是超大的并行计算机。但传统的并行算法运行时,效率会在增加机器数量后迅速降低,也就是说,十台机器如果有五倍的效果,增加到一千台时也许就只有几十倍的效果。这种事倍功半的代价是没有哪家公司可以负担得起的。而且,在许多并行算法中,只要一个节点犯错误,所有计算都会前功尽弃。
那么Google是如何开发出既有效率又能容错的并行计算的呢?
Google最资深的计算机科学家Jeff Dean认识到,Google所需的绝大部分数据处理都可以归结为一个简单的并行算法:Map and Reduce。这个算法能够在很多种计算中达到相当高的效率,而且是可扩展的(也就是说,一千台机器就算不能达到一千倍的效果,至少也可以达到几百倍的效果)。Map and Reduce的另外一大特色是它可以利用大批廉价的机器组成功能强大的server farm。最后,它的容错性能异常出色,就算一个server farm里面的机器down掉一半,整个farm依然能够运行。正是因为这个天才的认识,才有了Map and Reduce算法。借助该算法,Google几乎能无限地增加计算量,与日新月异的互联网应用一同成长。
·算法并不局限于计算机和网络
举一个计算机领域外的例子:在高能物理研究方面,很多实验每秒钟都能产生几个TB的数据量。但因为处理能力和存储能力的不足,科学家不得不把绝大部分未经处理的数据丢弃掉。可大家要知道,新元素的信息很有可能就藏在我们来不及处理的数据里面。同样地,在其他任何领域里,算法可以改变人类的生活。例如人类基因的研究,就可能因为算法而发明新的医疗方式。在国家安全领域,有效的算法可能避免下一个“9·11”的发生。在气象方面,算法可以更好地预测未来天灾的发生,以拯救生命。
所以,如果你把计算机的发展放到应用和数据飞速增长的大环境下,你一定会发现,算法的重要性不是在日益减小,而是在日益加强。
有关信息技术教程的文章
我们普通的教师是否也在教研?如果我们要在教学中不断成长,不断进步,就必须将教研进行到底。所以,我们千万要有一种自信:在教研行为中,我们不仅是被研究者和被培训者,我们还是教研的主人,教研的行者。......
2023-11-16
我还想重复一句,像歌儿唱的,我们要结交新朋友,但不能忘却老朋友!我深深感悟到与企业家们的合作,一是朋友关系,二是双赢关系,三是说得文化一点,是唇齿相依的关系。尤其广东省内,据统计已近千家了,约占全国总数的百分之七十。我做个不贴切的比喻,搞好与企业家的关系,成为真诚的朋友,我们生存与发展的空间就更大、更开阔!......
2023-07-15
对于一个普通的农家四合院的主门,冠以大门之称,是一种自然拔高的得意。我家也有一个大门,这个门除了以上的含意外,不折不扣的是个大门。自此后,祖母总认为老大门通了人性,产生了灵气,是门神保护了她,所以她对大门的感情远比被视为正宗的二门子深。又过了不久,我们举家搬出了老院,告别了大门,去生产队一间空房住。没有了大门的护佑,灾难很快降临到我们全家人身上。......
2023-08-09
我的主张是,在坚守中扬弃。教改形势潮起潮落,中华人民共和国成立以来由政府主导的课程改革已经进行到了第九次,但深刻反映教育教学规律的一些基本理论不会过时,这些理论的根源不少都可以追溯到我国古代,甚至直至孔子。而这些东西就是值得我们好好坚守的。......
2023-11-16
不能轻易丢掉自己的梦想据说是在1950年,澳大利亚新南威尔士州一群有见识的市民,向州政府提出一个建议,认为像悉尼这样一座繁华美丽的城市,需要一个文化的提升,他们建议建造一座艺术中心,以促进文化表演事业的发展。在人们心目中,悉尼歌剧院,已经成为一种海的象征,艺术的象征,人类精神的象征。略略沉思,她说了一句话,或许对我们每个人都有启示:人,不能轻易丢掉自己的梦想。......
2023-12-02
客户的满意是我们成功的基础华为生存下来的理由是为了客户。我们说客户是华为之魂,而不是一两个高层领导。要重视普遍客户关系,这也是我们的一个竞争优势。华为的技术人员在1天内从深圳赶到黑龙江,发现问题不在华为。如今,华为的地区客户代表处已遍布亚、非、欧、美等地区,较为完善的服务体系是供应链条正常运转的保障。......
2023-12-05
机器学习一般根据处理的数据是否存在人为标注可分为监督学习和无监督学习。因此,监督学习的根本目标是训练机器学习的泛化能力。总之,机器学习就是计算机在算法的指导下,能够自动学习大量输入数据样本的数据结构和内在规律,给机器赋予一定的智慧,从而对新样本进行智能识别,甚至实现对未来的预测。机器学习的一般流程如图6-1所示。......
2023-06-28
在安逸家庭里生活和舒适环境下工作的幸福中的人们,应该为灾区做些什么呢?单位派员赴灾区支援暂时轮不上,儿媳俩就捐出1500元。当从电视上看到汶川地震消息后,被温家宝总理亲临灾区指挥抗震救灾的情景所感动。他于16日携带近2万现金,买即日机票,只身赴成都,从都江堰到映秀镇,再奔绵阳市九洲体育馆灾民安置点,冒着多次余震的危险,连续几天几夜到自愿服务站请缨,系着红丝带,帮助搬运救灾物资、搀扶伤员到医疗救护站。......
2023-11-21
相关推荐