Guanliang MENG issues

Results 2 issues of


                                            Guanliang MENG

extending the tRNA database

>我用MitoZ组装和注释蜘蛛的线粒体基因组，得到的蛋白编码基因全的，但是注释二十几个物种，序列长度都超过14000bp，基本上都是缺了近10个tRNA, 组装的序列用在线软件MITOS能组装出来 ![image](https://user-images.githubusercontent.com/6203542/90248676-71aeba80-de39-11ea-9140-07f4c610ea28.png)

start codon position problem

![image](https://user-images.githubusercontent.com/6203542/68528347-610e6880-032c-11ea-9370-df0524e84f31.png) 这个应该跟参考数据库里面的蛋白基因本身的注释存在问题有关。应该是由于数据库里面的这个基因，由于他们上传的注释结果就是在目前mitoz给出的注释结果的后面（如果该基因在正链的话），导致mitoz将参考蛋白与老师您的序列比对时候，也只能比对到这个位置。 mitoz 会自动往前找起始密码子，找到第一个之后，就停止了。老师的想法是，只要能够往前延伸，就把坐标不断往前推？即使最终预测到的基因长度很长？因为参考数据库里边的长度也未必对如果参考数据库本身有问题呢只是我认为细菌线粒体什么的不会平白无故多出来一些非编码区域你也考虑一下吧其实这东西最好有转录组能验证但我的延长规律也是我一己之见。