太Skr了!小麦参考基因组还能这么玩!

来源: 发表日期:2018-08-02 浏览量:121

  一、小麦参考基因组的公开

  国际小麦基因组测序联盟(International Wheat Genome Sequencing Consortium, IWGSC)于2005年成立,其成员包含了64个国家的2400余名植物科学家、育种家、及测序专家,他们一直致力于小麦庞大基因组探索与不断更新(详见http://www.wheatgenome.org/About) 为世界各地的小麦研究解开序列谜团。

  经过多年不断的探索,2017年1月,IWGSC提前公布了组装程度较好的小麦参考基因组IWGSC RefSeq v1.0;目前,该网站的序列均可公开下载及使用,同时小麦参考序列RefSeq v1.0也已经公布到了Ensembl Plants网站上。参考基因组的方便获取为小麦的研究带来了很大的便捷。

  二、参考基因组的获取

  1、小麦参考基因组可以直接从IWGSC官方网站访问URGI进行获取,具体如下:

  打开IWGSC,依次点击Tools and Resources→Sequences→ IWGSC RefSeq assembly v1.0,进入下一个界面


  2、得到如下界面。这里就是小麦参考基因组的具体信息了,RefSeq v1.0数据库的包括但不限于所有染色体的Physical maps等信息。同时,在该界面中有四种功能项供我们使用:download、BLAST、browser、InterMine,这四种功能项是如何玩转庞大的小麦参考基因组呢?


  功能一:download

  1、点击download,进入下一个界面。


  2、得到如下界面。这里的每一条信息均为小麦参考基因组序列或组装好的各条染色体序列文件。点击各条选项便可进行序列的下载。


  功能二:BLAST

  1、点击BLAST,进入下一个界面。


  2、得到如下界面。在红框内输入序列或通过箭标选择需要比对的序列文件夹(.txt、.fasta),这里的举例为位于5D染色体上的Pm2序列。


  3、在Group下拉标中选择需要比对的数据库(当然选最新的RefSeq_v1,但若你的序列在这个数据库中找不到或遗传图谱跟RefSeq_v1共线性很差,需试试其他的版本)。这里选择5D染色体,若序列未知应选择all chromosomes。选好的数据库会在currently selected database中显示,也可以点击remove将其移除选择其他数据库,也可同时选择多个。选好后,点击Basic search,进入下一个界面。


  4、得到如下界面。由于这里只选了一条染色体,而且输入的序列是特异的基因,所以只出现一条结果。若出现好多条,可以选择左边红框的下拉框,选择比对效果好的结果。


  5、点击可以查看比对结果的chr5D,得到如下界面。通过序列比对,可以看到目标序列比对到了中国春参考基因组43405783-43409500的物理位置上,且比对率能够达到98%。


  功能三:browser

  1、点击browser,进入下一个界面。


  2、得到如下界面。篮框标注中显示了染色体信息及上面横红框中区段的物理位置,需要显示的具体项目可以从左边的项目栏中进行选择。


  3、这个工具最强大的功能之一就是可以截取指定区间的序列。例如,若要下载刚才比对到的43405783-43409500序列,在以下红方框中选择5D染色体,并输入区间43405783-43409500,点击Go,便可跳至目标区段,如下图。


  4、在左边选择“IWGSC RefSeq v1.0 Pseudomolecules”,在界面上会出现该项目,如下图。


  5、点击该项目会出现下拉框,点击save track data。


  6、点击后会弹出如下对话框,点击Save,便可进行序列下载了。


  功能四:InterMine

  1、点击InterMine,进入下一个界面。


  2、进入以下界面。即WheatMine网站,该网站包含了RefSeq v1.0的组装信息及annotation v1.0、annotation v1.1的注释信息。


  3、这个网站可以直接搜索或分析目标基因、标记、RNA等信息。以搜索序列为例,在红框中输入基因的序列号,点击SEARCH,进入下一个界面。


  4、进入以下界面,可以看出该基因位于1A染色体的3669097-3671050区间内,全长1954个碱基,点击FASTA,进入下一个界面。


  5、得到如下界面,即该基因的序列信息。


  总结:

  小麦基因组的庞大与复杂限制了小麦的研究进展,相信参考基因组的公开使用会将小麦各方面的研究提上日程;基因组获取很复杂,参考基因组的公开使用却很简单,不信就试试吧。


分享: