Gene Mhun_1149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mhun_1149
Symbol
ID	3922791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanospirillum hungatei JF-1
Kingdom	Archaea
Replicon accession	NC_007796
Strand	+
Start bp	1293690
End bp	1294901
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	41%
IMG OID	637896787
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_502616
Protein GI	88602438
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.215921
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAACA CAATAATTAA AAATATAGCC GAAATTGAAC ATCAGCCTTA TGAATTAATC 
CGGAAAGGAA TAGAAACCGG ATCCATTGCA ATCATGTACC GTGGTAATAT GGGAATTGCA 
ATCGGAACAG GACTCAGGAC AAAAATAAAT GTAAACCTTG GTACCTCATC TGGTCATTGT 
GTCCCAGAAG AAGAGATTCA AAAAGCGAAA ATTGCTGAAC TTTATGGTGC AGACACTATT 
ACGGACTTGT CAACCGCTGG AGACATACCA GAAATCAGAC AATCAATACG TGATGTCACA 
TCACTCCCCA TGACCACAGT CCCTCTCTAC CAGGCGGTTG CAGAAAATAC CCTTGATTAT 
CTCACTGATG ATCTCATAAT AGAGAACCTG AAAGAACAAA TCAAAGAAGA TATTTCATCA 
ATGGTCCTTC ATTGTCCCTC TAGACAGACC ATAAAGGCAA TGAAACAGAG TTCCCGCATA 
ATGGGAGTTG TTTCCAAAGG AGGCGCAATG ATGAGTTCAT TTATGCTAAA AAATAATCAG 
GAAAATCCCT ATATTACACA TTTTGATGAG ATTCTCACTA TACTAAAATC GAAAGATGTC 
GTCCTTTCAC TCGGAAATAC CATGAGAACA GGTTGTATCC ATGATAACCG GGATAGTGCA 
CAGGTTCTGG AGATAAACGA GAATATCCTG CTGGCACAGC AGGCTCATGA GAAAGGAGTT 
CAGGTAATTA TTGAAGGAGC CGGAGGACAT ATCAGAGCCG ATAAAATCGC AGAAAATATA 
AGGTACTACA AAGATAAGAC AGATTTTCCA CTCTTTGTAG CAGGACCACT TCCAGCGGAT 
GTTGGCATGG GATATGATCA TATTACCGGT GCGATTGGCG CAACATTCGC AGCAGGAGCC 
GGAGCAGATT ATCTCTGTTA CATCACTAGG GCAGAACATA AAAGTCTTCC GACTCCTGAT 
GAGGTCAAAG AAGGACTTAT TGCATTCCGG ATTGCTGCTC ATATTGGAGA TTCAATGAAA 
TATGGATTGT CTGAAAAGGA CAAACATATC GCTGAGAAAA GAGCGCAAAT GAATTTTGAG 
GAACAGGCAG CATTTGCTCT GGACCCGGAG GAAGCAGGAC GGGGTATTCC TATGGATACA 
AATTGTTCCA TGTGTGGATC TTTCTGTGCA CTAAAAATGA TTCAGACCTA TTGTAGAAGA 
ACTGATGAAT AG

Protein sequence

MNNTIIKNIA EIEHQPYELI RKGIETGSIA IMYRGNMGIA IGTGLRTKIN VNLGTSSGHC 
VPEEEIQKAK IAELYGADTI TDLSTAGDIP EIRQSIRDVT SLPMTTVPLY QAVAENTLDY 
LTDDLIIENL KEQIKEDISS MVLHCPSRQT IKAMKQSSRI MGVVSKGGAM MSSFMLKNNQ 
ENPYITHFDE ILTILKSKDV VLSLGNTMRT GCIHDNRDSA QVLEINENIL LAQQAHEKGV 
QVIIEGAGGH IRADKIAENI RYYKDKTDFP LFVAGPLPAD VGMGYDHITG AIGATFAAGA 
GADYLCYITR AEHKSLPTPD EVKEGLIAFR IAAHIGDSMK YGLSEKDKHI AEKRAQMNFE 
EQAAFALDPE EAGRGIPMDT NCSMCGSFCA LKMIQTYCRR TDE