如何写一篇家族分析文章(二)—家族分析实操(1)
首先,上一节我们介绍了木薯中Dof基因家族分析的一些基本内容,下面让我们进入实操部分。
此节,我们以草莓为例进行Dof基因家族的研究。
草莓基因组下载的网址一般有这么几个StrawberryGarden(http://strawberry-garden.kazusa.or.jp/),GDR(https://www.rosaceae.org/),NCBI(https://www.ncbi.nlm.nih.gov/),JGI(https://genome.jgi.doe.gov/portal/).这里,我们草莓选择的是二倍体森林草莓的基因组,因为这一版基因组质量较好,此基因组下载自JGI数据库。
按照我们做家族分析的步骤,一点点的来!
1.数据及序列下载
分别下载了水稻(RGAP7网站http://rice.plantbiology.msu.edu/)中30个和拟南芥(TAIR10网站http://www.arabidopsis.org/)中36个Dof基因。
草莓基因组数据下载自JGI数据库,以Fragaria为关键字进行搜索,即可下载,记得要登陆才能下载!
下载下来是这样的一个压缩包,解压缩就可以了!
2. 草莓中Dof家族成员的鉴定
用到的软件:HMMER3.0,TBLASTN(我们这里用本地BLAST)
涉及到的网站:Pfam,SMART,GeneMark.hmm
Pfam号为:PF02701
2.1 接下来,我们用两种方式来产生hmmer3.0可以用的hmm文件:
第一种:
首先,我们先在Pfam数据库中下载PF02701对应的比对文件,格式为stockholm。
然后,下载hmmer3.0软件,我们下载windows版的即可。
最后,建立hmm文件:
首先,要将草莓全蛋白序列文件和比对文件放在hmmer3.0文件夹下:
其次,DOS命令窗口下运行hmmer3.0:
最后,利用hummbuild命令创建hmm文件:
第二种:直接从fam下载hmm文件,然后修改文件。
这样我们就有了hmm文件。
2.3 hmmsearch鉴定DOf蛋白
命令行为hmmsearch hmm文件 全蛋白序列 >结果文件(自己命名)
结果显示如下:
结果显示有七条序列符合要求,且e值均小于1e-5.
2.3用本地blast进行Dof蛋白的鉴定
这里我们用Bioedit软件中的本地BlastDof蛋白序列的搜索。
03:44最后,结合hmm结果,将野生草莓的dof序列保存到一个txt文本中。