上节回顾:数据前处理,过滤最小等位基因频率≤0.05的SNP位点。

本节主要内容是:利用rTASSEL对自己的数据进行全基因组关联分析。


(相关资料图)

一、从路径读取数据

基因型数据的首行和基因型数据如下:

*共238份样品,97276个SNP位点。

二、数据过滤

*可以看到数据过滤后剩57227个SNP位点【这里缺失率依据样本自行调整】

三、计算亲缘关系

四、计算混合线性模型(MLM)

五、数据结果可视化绘制曼哈顿图(Manhattan)

注:这里一开始使用rTASSEL中的内置包绘制曼哈顿图踩了一个坑,是自己数据的问题。

很好,自己的数据成功白屏。9w SNP还是挺大数据的。

换种思路,让他直接导出到PDF文档中。

*额……一开始以为是数据量太大。后来想起自己文件的Chr数据直接是基因,而不是染色体。

那咱就直接导出数据包,然后手动进行修改哈。不要难为自己,一码到底。

导出后的数据:

修改后数据,直接保留作图需要的四列即可。

后边就可以寻找具显著关联的染色体和位点啦!

预告:

1.     CMplot、qqman代码简介。

2.     对hmp文件进行修改。(这里使用自己的数据进行分析时出现的问题)

3.     修改曼哈顿图绘制数据中的染色体一列。使用qqman染色体位置需要用数字类型,像小麦这种染色体命名为1A、1B、1D的命名方式需要修改成1、2、3才可以用qqman作图。

……【后续想起来再补充】

【最复杂的代码,做最简单的事。】 

推荐内容