联多科技报表?
作为在联多科技实习过两个月的实习生,看到这个问题还是有点感触的,写一篇文章来记录我在联多的经历吧!希望对你有帮助! 我们组主要做医疗大数据方面的研究,所以平常看的数据都是跟医疗有关的,用的软件主要是R和Python,因为导师比较喜欢使用Python做数据分析,所以我也就跟着学了学,用Python做了一些数据处理的工作。 下面给大家介绍一下我在这两个月里做的内容。(因为有些数据是有隐私信息的,所以不能放太多真实的图片) 这是用Python做的词云分析,关键词是“癌症”、“肿瘤”什么的,为了看词汇出现的频率,把文字内容提取出来之后输入到WordCloud里面,生成的词云; 这是我用R语言做的热图,是以GeneID为行,基因的表达量为列,根据表达量的不同分为5个等级,然后用R语言里的heatmap包生成热图的代码,这个图是为了看基因在肝癌细胞系中的表达情况,根据表达量不同划分的5个梯度用不同的颜色标注。
除了看基因的表达,我们还看了基因与疾病的关系,比如说基因与癌相关的信息,下面这图是利用GEPIA(一个在线的基因数据挖掘平台)看到的结果,点击页面左边的GeneID就可以进行详细的基因信息查询,比如我点了一下CDKN2B,出现以下界面 然后可以点击界面上的EXPORT,选择需要的格式,就可以下载想要的文件了。
除了查看基因与疾病的相关性以外,还可以查看基因与蛋白之间的相互作用关系,以Myh1为目的基因,输入基因名称或者基因ID都可以,点击搜索就可以看到以下结果 然后就可以看到目的基因与其他基因的相互作用关系了。
以上就是我在联多科技实习期间所做的内容,希望能帮到你~