本文从blog.163.com/kazenoyume@126/上迁移过来

自从清华保研成功后,我就一直想找个机会去他们那边适应一下实验室的生活。毕业设计这个事情给了我一个很好的契机。从2月17号到4月30号,我在清华度过了一段不愉快且不寻常的日子。

回顾这两个半月,我学到的东西不算多也不算少:

  1. 初步熟悉Cassandra的API(Thrift、CQL)调用,并对Cassandra的底层有一定的了解。现在已会构建Cassandra集群,操纵Cassandra表。
  2. 学习完DataStax的Cassandra课程。
  3. 熟悉了Yahoo Cloud Service Benchmark(YCSB),并看过其源代码。并在一定程度上尝试修改过其代码。
  4. 同步学习Cloudera上Standford Machine Learning课程,目前还差3个星期的作业便可以拿到课程结业证书。
  5. 学习了欧拉回路以及网络流算法。在这个期间,我大约做了30题Online Judge。

从我所学到的东西来看,我对此次的清华之行还算感到满意。但是,我并不觉得这两个半月的学习是愉快的。特别是最初在那边的1个月感觉特别不适应,这种不适应体现在两个方面,一个是生活习惯上的不适应,另外一个是团队的不适应。

生活习惯上的不适应体现在吃喝住行上面。在我到清华做毕业设计期间,清华并没有给我提供住宿。为此,我需要自行需找住的地方。而北京的房价是出了名的高,就连清华附近一个不通风的地下室单间也需要1.7K一个月的月租。为了节省成本,我没有考虑那些需要通过中介才能租下的房子。经过多方面的折腾奔波之后,我找到的是中关村附近的一个小隔间,成本是1.2K一个月,包水电。小隔间大小不过5平方米,里面刚好够放一张床、一个小衣柜、一张电脑桌子和一个床头柜。等我把屋子打理完之后,我才开始慢慢理解“蜗居”这个词的含义。当初《蜗居》这部剧刚推出的时候,我一直以为这个词离我相当的远。身为一个土生土张的广州人,因为父母努力的赚钱买房子的原因,我并没有直接感受到房子问题给我带来的压力。但是,这次的毕业设计真的让我明白什么样的生活才算是蜗居了。除了学习和工作,其余的休息时间全在一个只有一张床的小隔间里面,你就明显觉得在这个金钱操控的时代里面,自己是多么的渺小。我们这一辈人,离乡背井,为的就是追求自己心中的那个纯真的梦想。

在吃方面,我对清华饭堂的感觉就两个词语,鸡肉和土豆。真的,在清华访饭堂里面,无论你到哪个窗口,你总能看到这两个东西出现在各种菜里面。相比起中大,清华饭堂真是弱爆了。还有一点不得不说,我真的明显觉得北京的餐厅菜式特别的少,我住的地方楼下那几间饭店我都已经吃得腻了,果然吃在广州!

在北京,我就看过两场电影,《里约大冒险2》和《超验骇客》,两场电影打了半折之后居然还要75元,真的不得不感叹一下北京人们的生活消费水平之高。

对了,还有我最喜欢的排球。我发现在北方这边,真的很多人打排球。他们打球的风格跟我们南方完全不一样,他们讲求的是身高以及力量上的压制,在发球扣球上做得特别的好。他们两队之间的对抗是两队3、4号之间的对抗。一般他们的接扣都很难接到位,导致最后一球基本都是调整攻。而且,他们这边的人的灵活性比较的差,扣球节奏并不快,有心来拦截的话其实还是比较容易的。我在北京也看了一下清华二队的比赛,感觉他们的实力完全在我们学校之下。我得出这样的结论的依据是,他们打法死板、灵活性差。

现在回想起我刚到实验室的那一天,我还十分高兴地跟师兄在讨论技术问题。比如为什么实验室团队使用JAVA而不是C++,对大数据的看法等等。后来师兄给我两篇有趣的paper,一篇是关于SEDA的,另外一篇是关于Gossip的。这两篇文章都相当有意思,我还总结了一下这两篇文章的思想以及把他们做成了PPT给组员分享。

再到后来做毕业设计的时候,实验室的师兄给了我两个题目,一个是Cassandra分布式日志收集系统,而另外一个是Cassandra长表与宽表之间性能的比较。当时我觉得第一个题目没什么意思,很利索地就选了第二个题目了。刚开始时对Cassandra不太熟悉,所以对第二个题目也没什么了解。但是当我对Cassandra了解的逐渐深入,明白老师的研究重点之后,我发现这个问题其实是一个软件工程的逆向建模的问题。它们希望使用Pertri网的技术手段,把源代码逆向建模,把Cassandra分析透切。我直觉认为做这个研究的结果可能是长宽表之间性能是一样的,而且我也对代码的逆向建模这个技术并不太感兴趣,后来题目就换成“Cassandra负载均衡优化与分析”了。这个题目是有项目技术背景。当时他们在做三一重工的项目时,他们发现由4台低配置机器和2台高配置机器所组成的集群的性能居然比只由2台高配置机器所组成的集群性能差。随着我对Cassandra理解的深入,我发现到导致这个问题的原因是因为他们对Cassandra中DHT理解的不深入。发现这个之后我真的十分的无语,但是毕竟有毕业设计的压力在身上,只能凭空去造一些优化策略出来了。

在做毕业设计的过程中,我发现了另外一个大道理。这个道理说出来可能很多人都会明白,但是很多人却又做不到–“得人心者得天下”。在跟我们小组师兄相处的过程中,我发现师兄在这方面的确欠缺一点。作为大四本科生的我,我想的只是如何能够在短时间内完成一个能拿得出手的以及自己为之努力过的毕业设计。而对于他来说,他想的是如何把这个毕业设计做得更像一个学术研究,并且把这个研究结果发表成论文。我跟他多次强调了我的deadline紧迫的问题,并且我不止一次跟他说过我希望他能找出一个在本科生能力范围内的课题来做我的毕设。我跟他也曾经因为这个问题而争吵,那次争吵的音量可以让整个实验室的人都听到。而相比之下,另外一个小组的师兄他只要知道某个人想要做什么样的东西,他就给那个人安排什么样的任务。而且,在工作汇报时,无论那个人做的是好的还是坏的,他都会以一种鼓励的语气去让那个人继续完成他的事情。我相信这个小组师兄的做事方式才是我该学习的做事方式。

我希望毕业之后能去到像Google这样的外资互联网企业工作。在大四期间,我见到身边已经有几个出国到Google工作的例子了。假如我能马上进入这些公司的话,我会马上放弃读研。因为这个问题,我曾好几次找过我的研究生导师,跟他交流我的想法。他是非常认同我的想法的,他还鼓励我现在尝试去投一下这些公司的简历。我也按他的意思应聘了Google、Amamzon、Yahoo和Hulu公司的实习生招聘。但是可能是由于准备不足,没有一个公司打电话找我交流。后来我又想到了希望在研究生阶段能做对自己以后就业有利的事情。我一直在数据存储和数据分析两个方向之间摇摆不定。有一段时间,我每天都在想这个问题。后来权衡利弊之后还是选择了数据分析这个方向了。

这次清华之行的确让我成长了很多。它不仅让我学到了一些有用的知识,还让我知道了一些待人处事的道理。期间还认识了不少以后即将成为同学的朋友。不过开销有点大就是了。