华中大-2017伯克利交流之旅(3)
作者: 发布时间:2017-08-21 点击率:62 编辑:文芳
伯克利暑期学术课程日志(8月3日)
在旧金山的第三天,阴阴欲雨的天气。晨间的伯克利是凉凉的,凉凉的风、凉凉的水,吹散课前的一夜倦意。在The Faculty Club Room: Seaborg,我们开始了新一天的学习。
上午的seminar是与机器学习模式识别相关的生成式无监督学习,“Reading, Literature Research; Tackle The Hardest Part of Machine Learning: Unsupervised Learning”。因为组内有两名同学来自自动化专业模式识别方向,他们对这课的兴奋与期待传染了其他组员,大家一进教室就占领了第一排,希望与老师能够有更多的交流。
在同学们对于新课的讨论声中,一位穿着蓝色衬衫,背着超大的双肩包,散发出书生气的年轻人走到了教室最前方---他,正是这堂课的讲师:Doctor haoyu chen。Chen是伯克利数学科学导论研究生导师,致力于开发GPS卷积神经网络,加快分布式GPU上DNN的培训。他在深度学习的技术推进上做出了重大贡献,现任Google高级工程师,致力于开发反滥用技术。他的研究方向正是深度学习中较为困难的一个分支:生成式无监督学习(Generative Unsupervised Learning)。
Doctor Chen首先讲解了现实中存在的生成式无监督学习的三大基本模式。分别是:
离散的可叠加的数值模式(value pattern and linear superposition)
图1value pattern and linear superposition
连续的可扭曲的几何模式(simple geometric pattern and domain warping)
图2simple geometric pattern and
domain warping
综合的分层的复杂几何模式(Hierarchical
geometric patterns and parsing the signal)
图3Hierarchical geometric patterns and parsing
the signal
有了这三种基本模式的概念,大家再去理解deep
vision就会发现不再那么抽象,而deep learning的过程和趋势也变得清晰易懂:通过下一层的特征——去除边缘特征最大化提取特征——形成新的特征集合——去除边缘特征最大化提取特征——再形成新的特征集合。如此迭代循环,使得数据特征从浅层到达深层,从特征的识别到达整体结构的识别,从小数据到达大数据。
图4Deep
Visualization
接着,Doctor Chen为我们解释了监督学习和无监督学习的区别,其实非常简单,区别就是给机器学习的数据样本是否被人为标记(labled or unlabled),监督学习就好比告诉机器这些图是猫,这些图是狗,那么请判断另外一些图是猫还是狗,而无监督学习则没有告诉原始自然图是猫还是狗,需要机器自身去不断提取特征进行逼近,最终达到能够判断是人造图还是自然图,最后chen还指出了两个无监管学习最新的研究方向:Adaptive deconvolution neural networks and Deep convolutional generative
adversarial networks。
复杂的理论概述部分结束后,Doctor Chen为我们带来一些轻松感性并且意义深刻的分享:他以古诗为引,向我们讲述他这些年来做学问所积累的经验。
图5 陈羽北学长授课
其一,“不学诗,无以言”。诗是字简意深的文学作品,也比喻作大浪淘沙后历久弥新的各类经典著作。陈学长以此为喻告诉我们,把各学科领域的经典文献著作学好学扎实,是学好自身专业最坚实的基础。陈学长讲到,他的研究方向是产生性的非监督学习,为了做好研究,就必须学好概率论、图论、小波变换等经典内容。他甚至还会反复看一些1950年以前的paper,温故知新,常有所得。“书读百遍,其义自见”。做研究至今,他也常常会出现一时半会儿不能理解一些知识,先把它们放一放,等到过几天再来看时,却觉得豁然开朗,以后每过一阵子再来读一读,每次都会有新的心得体会。
其二,“昔时金阶白玉堂,即今唯见青松在”。他建议我们,需要培养正确的学术史观,从长远的角度出发辨析事物的发展方向。或许某个当下热门的研究领域,在五年或者十年后,就会渐渐淡出人们的视野。如果搁置自己的兴趣在旁而一味地选择那些热门但不感兴趣的方向,只会让我们成为follower。
其三, “纸上得来终觉浅,绝知此事要躬行”。实践是证明理论不可或缺的一步。所以在专注理论研究的同时,应当同时注重实践,亲自操作去检验结果的正确性,而不能空谈理论。“衣带渐宽终不悔,为伊消得人憔悴”。既然选择做一件事情,那么就要拿出全部的决心和努力,小到坚持读书,大到实现自己的人生目标,无不如此。
两小时的交流,令我们受益匪浅,陈学长作为一个理工科学生,可以将文学感悟和科学启发融合起来,由一个方面悟出另一个方面的道理,不得不让我们感到敬佩。
图6 陈羽北学长与同学交流
下午的课程则是由Raoul Oliver Martin研究员带来的“Cryo-electron Microscopy: The Mixture of Biophysics, Biochemistry, Microscopy, and Engineering”。Raoul Martin是Nogales Lab优秀研究员、伯克利本科生导师,精通于冷冻电子显微镜的设计与使用研究,在极低温(可达-269°)环境下观察研究物质结构。
他由中心法则入手,介绍了蛋白质的四级结构:一是氨基酸所链接而成的肽链,二是肽链的α螺旋结构和β网状结构,三是同一肽链由于不同位点 R基的相互作用,诸如氢键,二硫键,离子键等作用而弯曲折叠,四级是多条弯曲折叠的肽链组合成复合体,比如人体的血红蛋白由 4部分构成。
图7Raoul Martin授课
接下来他介绍了一下这项技术的原理和仪器结构。首先介绍了3种目前主流的观测蛋白质结构的方法,一是核磁共振光谱,二是x射线结晶衍射,三是低温电子显微镜。而低温电子显微镜的优势就在于它能观察分子量较大的蛋白质。结构方面,主要分为电子枪,电磁透镜,电子收集检测器。其原理与普通电子显微镜相似,只不过在处理生物材料方面,运用了冷冻技术和压缩技术。
图8Raoul Martin老师耐心回答学生提问
这堂课老师不仅带我们复习了生物知识,也详细讲解了这项新技术(2015年才被发明),帮助我们拓宽了自己的知识面。同学们在课上与老师的互动十分积极,即使是简单的问题,老师都认真耐心回答,这大概就是他做学问的态度,谦虚而严谨。
傍晚时分,我们前去参观伯克利的图书馆。整个图书馆庄严肃穆,白色的立柱大门上竖着青色的雕塑。刻着“LIBRUARY”横幅的石匾厚重地立在高大的门之上。
进入图书馆,首先引入眼帘的便是马克吐温的雕像,他坐在那里,手里拿着一本正在写手稿,仿佛和身边的人在讨论着什么,又好像在沉思。随后我便注意到了图书馆的地面:地面全部是大理石的,但是经历了百年的磨损踩踏,许多地方都被磨得锃亮锃亮的,甚至有些大理石都被踩塌了下去。值得注意的是学校并没有更换这些大理石板,并不是因为没有钱,而是因为在他们眼里,这也是一种文化。
图9静谧的图书馆
图书馆的阅览室里面更是非常安静,使我们都不由得小心翼翼地走路,生怕弄出了唯一的噪音,据老师所说,每当考试季来临,这里的学生甚至会学习到选择在图书馆过夜。我们听完笑谈:“难不成他们也需要考试之前突击混高分?”老师补充道:“其实,平时他们也有在这里过夜,因为这里的学生平时也经常有做project,这是他们中很多人的日常。”听完之后,我们不得不对Berkeley的学术之风表示由衷的赞叹。
斜阳初绽,暮色徐临,为了解决今天课程上还存留的难点疑点,TA赵桪乙同学主动带领大家在酒店后面的院子里做今日课程的互动研讨会,大家积极提出困惑,互相讨论解答。
图10 TA赵桪乙同学为大家解疑答惑
这些我们共同经历的从互不相识到愈加默契,从好奇向往到日有所获的过程,路上的欢声笑语,课上课后的求知若渴,这些沉甸甸的知识和故事啊,正是我们至此一趟,最珍贵的记忆。
作者:俞前辉(自动化15级)、叶杨(自动化15级)、卢丽莹(自动化15级)、鱼一飞(船海14级)、高祥云(材料14级)、庄旭东(能源16级)