Guanliang MENG
Guanliang MENG
>我用MitoZ组装和注释蜘蛛的线粒体基因组,得到的蛋白编码基因全的,但是注释二十几个物种,序列长度都超过14000bp,基本上都是缺了近10个tRNA, 组装的序列用在线软件MITOS能组装出来 
 这个应该跟参考数据库里面的蛋白基因本身的注释存在问题有关。应该是由于数据库里面的这个基因,由于他们上传的注释结果就是在目前mitoz给出的注释结果的后面(如果该基因在正链的话),导致mitoz将参考蛋白与老师您的序列比对时候,也只能比对到这个位置。 mitoz 会自动往前找起始密码子,找到第一个之后,就停止了。 老师的想法是,只要能够往前延伸,就把坐标不断往前推?即使最终预测到的基因长度很长? 因为参考数据库里边的长度也未必对 如果参考数据库本身有问题呢 只是我认为细菌 线粒体什么的 不会平白无故多出来一些非编码区域 你也考虑一下吧 其实这东西最好有转录组能验证 但我的延长规律也是我一己之见。