对于一个评估窗口的544x13矩阵,我对k-means++算法进行了优化,然后用优化后的算法进行聚类,将544个行向量聚类为50类,在可视化方面,每一类则代表一个波形,对于每一类,我们可以利用该类所包含矩阵子集的每一列算术平均值来产生该类的标志性波形。”
陈元光把打印好的论文递给莱维特之后,简单介绍了一下他的思路。
莱维特的重要工作方向中就包含蛋白质模拟,通过计算分析蛋白质序列去预测蛋白质结构,专注于同源建模。
陈元光写的论文和他的方向高度一致,而且体现的思想和算法的优化都有非常高的价值。
刚开始莱维特还有些不以为然,因为他知道对方还是大四学生,他觉得对方拿出来的论文不过是为了找话题写的论文,充其量是篇概括的不错的综述。
结果没想到一上来就放大招,无论是设计的计算规则,还是说对经典聚类算法k-means++的优化,都充满了思考。
“很棒的工作。”莱维特点评了一句后,和陈元光围绕论文中的一些细节问题进行讨论。
而郭伟则陷入了怀疑人生的状态,我是谁,我在哪?
郭伟是13年加入鹅厂的,5年时间做到了鹅厂视频的高级经理,也是名校毕业出身,因为做版权运营经常需要出国的缘故,英语没有落下,不是那种四六级考试通过的理论派,说的不好,但是也是能用英语直接对话的。
他就只见陈元光和莱维特之间nicetomeetyou完,陈元光递了一沓纸给莱维特,然后双方的聊天内容他就完全听不懂了,大量专业词汇,他连蒙带猜都听不懂什么意思。
郭伟心想,现在的年轻人都已经这么猛了吗?
“没错没错,是这样的,有保留区域来避免dhr8的内部螺旋氢键相互作用的点位被破坏,避免破坏重复蛋白结构基序,这种设计是对的,这样的模拟既能模拟真实情况,又能把突变限制在一定范围。”
“很棒的点子,不断随机模拟,然后挑选出差异度最小的作为最佳匹配,然后和波形比对计算出拟合优度。”
莱维特对陈元光的论文大加赞赏,本来莱维特给这场对话的预留时间是十五分钟,现在聊了两个多小时,他还有点恋恋不舍。
“元光,你的论文只差一个东西,那就是实验去验证你的理论,利用你模拟的办法把drh8改造成可以结合核酸的短肽。
有那个这篇论文可以发nature,没有那个也能发,不过可能只能发子刊。”莱维特说道。
陈元光回答道:“我有思路,后面我去找学校申请,把它完善一下。”
因为之前没有实验室给他用,所以陈元光的这篇论文完全是计算模拟,差实验检验的部分。
莱维特问:“这篇论文是你一个人独立完成还是和其他人共同完成?”
光是刚刚双方的沟通,莱维特知道这篇论文的主要贡献者肯定是陈元光,因为里面的思路和设计,他说的非常清楚。
陈元光说:“我一个人。”
莱维特说:“那到时候发nature的时候,如果你不介意可以给我挂个第二作者,这样它就肯定能发表在nature上了。”
(本章完) ', ' ')