习惯了美国这种工作和生活分得很清楚的节奏之后,我们也周一到周五安心上班,周六周日四处happy。匆匆忙忙又一周,唯一的区别就是我们有两个人考了托福。不管是出于把托福分刷得更高一点的想法,还是确实想体验一下美国和中国的托福究竟有什么区别,总之周五两人一大早出去,回来之后就只有一句话“来美国之后还没起这么早过”就倒头便睡——真是难为这两人了。
周六下午突然心血来潮:去市中心看看吧!于是一场说走就走的旅行就开始了。但是在美国“无车寸步难行”毕竟还是现实,所以只能老老实实地等公交车。美国的短距公共交通远没有国内发达,因为私车已经太多了。等了半个小时才终于等来了一辆,一问我们还等错地方了,于是又屁颠屁颠地跑到另一边,不过这次车很快就来了。看着街两侧的建筑物不断拔高,我们也终于进入了市中心。于是就跟乡巴佬进城似的,对各种西洋式建筑和高楼大厦拍照留念。最让我们惊讶的是,在市里面竟然还能偶尔看到马车——没错,是真的有一匹马在拉车,想来是供游客游览城市的,这业务在中国的市中心倒还真是发展不起来的。
李允恺
这周继续在为眼动轨迹分类的成功率而奋斗。继上次我和导师讨论完分类的特征提取思路后,我们就把重点放在点的聚类和模式匹配上了。而我主要考虑按环形聚类和按方格聚类。对于眼动轨迹,我们认为分布上并不是绝对距离越近两个点的相关程度越大,而是离中心等距的点相关程度越大,这是容易理解的,因为一个图像总是以最感兴趣的区域为中心形成的。在初步实现聚类之后,我发现把聚类区域分成三个环形进行计算对于我们的实验数据是最合适的;但方格聚类并没有用到全部的区域,因为兴趣点和扫描轨迹的分布是近似呈高斯分布的,为了尽量减少一次性送入过多的数据进分类器而削弱有价值特征的权重,我只选取了中间的部分。
我们的实验数据来自约200张图片,7个测试者,经过我们的观察,不同组实验数据在注视时间,扫视速度等特征上面都有很大的不同,想要用统一的标准完成实验功能并不太现实,所以我们又分别对这些数据进行了归一化,尽量用分数的形式表示它们。
然而不管是通过模式匹配还是归一化,最终分类成功率都达不到50%,而且对每个特征进行贡献值分析,他们的贡献值基本都为0,这让我一阵头大。周五晚上7点去见导师,和导师又讨论了约一个小时。虽然到目前为止我们已经用了很多复杂的方法,不再只是我疑问中的那些简单的方法,但是依旧没有取得明显的效果。最后老师说,或许我们确实不能通过眼动轨迹的模式匹配来完成分类的功能。我说这样感觉可不够好……毕竟也为之琢琢磨磨一个月了。老师说虽然我们没有成功,但我们还是知道了些什么。好吧,我也会这样安慰自己的!
但是不管怎样,我们确实知道了些什么。或许这些特征对于图像分类来说效果并不是那么令人满意,但是对于我们另一个实验,通过测试者观看视频的数据来判断他们是否存在某种病变应该还是会起到很好的效果的。我们也通过目前的实验掌握了基本的思路,也了解了不同人眼睛运动轨迹的特点,相信下一个实验会做得比这个更成熟。
何梓奇
大约一个月,文件基本处理功能实现之后,我开始进行信息提取。我们都知道,模式识别的一个关键就是选取模式,而所谓模式实际上就是特征。一张图片的所有信息我们可以认为是每一个点的值,和值与值之间的位置关系。但是这样信息量太大,不利于分类,故而我们需要将信息进行浓缩提取,将一个图片变成若干个特征的值,而这些特征就是模式。目前我们准备使用的分类算法是Random Tree Algorithm。目前我们选取的四个度量标准是:峰值面积对峰值比,峰值对峰值比,峰值面积对峰值面积比,和峰值面积重心(centroid)。我当前的工作就是完成这四个度量标准的提取计算程序。
除此之外,我还去南德州大学参加了一场托福考试。南德州大学与休斯顿大学很近,走路也就二十多分钟,由于平时都是在校园中生活,这次走在街上的感觉也十分独特。明明是大白天,却安静的可怕,除了偶尔呼啸而过的汽车,几乎无法看到任何行人,马路两边的房子也比较老旧。走到南德州大学里面,可能由于是周五的原因,整个大楼空荡荡的,但是灯火通明,自己的脚步声还在走廊里回响,非常有美国恐怖片的氛围,总觉得大白天,明亮的灯,一个人都看不见,与午夜一样的安静形成强烈的反差,巨大的违和感。只能说虽然来这儿一个月了,我还是没有彻底习惯这儿人口稀少的环境吧。
范青君
本周没什么惊天动地的大事,也没什么值得一提的娱乐活动。也就是学姐买菜时捎带上我,去一家名叫Whole Food的食品超市逛了一圈,换了换口味,这次买了4.99刀一小盒的黑莓,味道一般。美国大多数水果感觉都挺精致,如果像西瓜那样吃估计会造成很大的经济负担。买菜之后顺便还去中国城吃了一顿,我点了一道“招牌烤肉饭”,请学姐喝了一碗“羊肉汤”,算是讨好讨好她,毕竟中国城还是比较远的,开车得不少时间。虽说是中国城,但只要不是川菜馆,总感觉味道会和地道的中国菜有些偏差。
经过这么长时间的不懈努力,终于把CMOS这本书看完了,对IC这个方向有了一定的了解,也感觉到了这个专业方向为什么做的人并不多,因为确实很难。回想以前在学校修过的数电,模电那些课,只能说太过浅显,以前为了期末考试,到处搜集往年的试卷,真正到了考试的时候,或许还要挠挠头皮,然而,就这边导师对我们(作为做研究的博士生)的要求来看,那些试卷上的题目应该一眼就能看出结果,而不是挠着头皮算一番——也难怪导师觉得国内本科生基础太浅了。虽然我不敢说现在已经达到了导师所要求的标准,但我相信也不会太远了。记得以前最害怕的就是电路类的实验了,所有元件的数值都经过计算,面包版上的线也布的好好的,但就是不出结果。现在想来再理所当然不过了,板上的低精度电子元件往往会有20%以上的误差,加之不同的排版布线会在不同位置催生出不同程度的寄生电容,我们过去实验中用的计算模型又太过简化,忽略了很多影响因素,这样的条件下想要出结果就像是抽奖一样概率低下。而到了真正的电路设计与制造时,情况则变得复杂得多,仿真软件用的应当是一代代传承下来,较为精确的模型,设计前就得考虑制造的不精确性,封装,电磁环境和温度对电路的影响。版图设计过程中也要考虑排版布线对电路的影响,比如两个对称的MOS管必须让其处于几乎完全相同的环境下,方能将失配减至最小,如果还有一定程度失配则需采用其他手段消除。版图设计出来后需生成每一点的寄生电容,在考虑其影响的条件下进行仿真,如果结果不达要求则重复上述过程。
张文杰
这一周导师出差,所以我基本处在自己摸索的阶段。不过导师布置下来的Water-Filling algorithm 实在是很有挑战性,网上搜索到的文献基本上都是关于这个算法在正交频分网络确定发射功率等场景中的应用,这应该是电信系的看家知识,但和自己专业却不太合拍。对于出身自动化专业的我来说,大学期间学过和通信相关的,大概就只有信号处理和计算机网络了吧,而且两门课的着重点都在控制系统上的应用,所以正交频分网络我只知道个概念,但是具体的计算什么的我就不太清楚了,而且最重要的是,用Water-Filling Algorithm在正交频分网络中的应用来解释Water-Filling Algorithm算法本身,又真是一件“事倍功半”的事。然而除了在正交频分网络上的应用外,我几乎都找不到其他文献了,而图书馆里的相关资料又全是英文的,而且是当成一本书的课程来讲,对于我这个任务来说,无疑于远水解不了近渴。所以一时之间我实在不明白这个算法到底有什么优越性,以至于导师让我用这个算法解决我一直在思考的无线充电设备分布优化问题。
当然也可能是自己理解错了导师的想法,是否导师所指的Water-Filling Algorithm 其实是Watershed Algorithm? Watershed Algorithm的本质,举例来说,在图像处理上的应用就是把图像的灰度值转换出来,构建一个三维图像,然后想象从最低点开始注水,水漫过“堤坝”后就开始填充其他地方,用这个方法可以分离图像部分。如果我的猜测是正确的话,那么把这个方法用到我的优化问题上倒是值得一试,虽然我的问题是个多维空间下的优化问题,用这个算法计算我并没有接触过,但是可以一试,所以接下来的时间我就专注于这个算法了。等导师回来后,要和他好好聊聊这两种算法。
温晨曦
这一周继续在实验室进行传递函数快速计算的研究,不过重心更多地放在了文章的撰写上。我电磁背景比较缺乏,所以并没有从introduction开始写,而是直接写的实验部分。
实验部分主要由三个部分构成:基函数的选择、方程条件数的优化和稳定性实验。基函数的选择这一部分的重点在于对现在选用的基函数的理论推导,包括基函数基频的计算和基函数类型的选择。由于基频计算是由冯石学长完成,这一部分我主要负责后面的相应工作,包括基函数阶次的选择、基函数拟合效果评估和误差计算等等。下图是我们采用的基函数的拟合效果。
左上和左下分别是测量获得的传递函数的模和相角,右边是拟合得出的模和相角。可以见到,拟合效果还是非常不错,与测量获得的传递函数十分接近。
第二部分重点在于如何优化方程的系数矩阵,使其条件数降低、抗测量误差能力增强。关于这一点,正如我上一周周记所写的那样,使用gram-schmidt方法将基函数分解为归一正交的向量。这一周我的主要工作在于优化了测量路径的选择,使心脏起搏器导线得到的切向感生电场线性独立并且尽可能正交。经过一周的努力,我成功使拟合误差降低到了原本的四分之一,使其抗误差能力大大增强,为今后实地测量做实验打下了基础。
第三部分与第二部分联系紧密,可以说是第二部分成果的具体体现。通过我和学长的讨论,我选择了几种比较合理的误差计算方法来评估拟合效果。从实验结果上来看,条件数优化的结果不错,希望在今后几周可以有更多的进展。