Gene Mbur_1848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbur_1848
Symbol
ID	3997509
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcoides burtonii DSM 6242
Kingdom	Archaea
Replicon accession	NC_007955
Strand	+
Start bp	1946666
End bp	1947913
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	48%
IMG OID	637959592
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_566481
Protein GI	91773789
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.487586
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACCCA CACAGGTAGA ATACGCAAAG AACGGTACGA TAACCCCGGA AATGGAATAT 
GTGGCCGAAC ACGAGTCCAT TTATGTGGAA ACTGTAATGT CAAGGGTTGC AGATGGCAGC 
CTTGTAATAA TGGTTCGTGA TGGCTGTCCT CCGGTAGCTA TTGGAAGAGG GGCTAAGACG 
AAGATTAATG TCAATCTCGG AACCTCTTCT GCGAGCATCG ATCCCGATGC TGAACTGGAA 
AAAGTGAAGA TCGCGGAAAA ATACGGTGCA GATACCATAA CGGACCTGTC AATGGGTGGC 
GATATCTCTG CTATAAGGAA AATTGTCTTT GATAACACCA CTTTACCTAT CACAACCGTG 
CCGGTTTATC AGGCGGTCGT TGAGTGTGGG ATGAAGGATA CCTCCAGCGA CGATGTGCTT 
TCCTATCTTA AGAAACAGGT CGATGAAGGT GTCAGTTCTG TTGTGGTCCA TTGTGTGGAA 
AAGCAGATGC TTGAAAAGCT CAAAGGTACA GGACGTATCA TGGGTATGGT CTCAAAGGGC 
GGTTCCTTCA CCAGTGTTCT TATGCTGAAG GACGGTTGTG AGAACCCCTA TCTTGAGAAT 
TTCGATGAGG TCCTTTCTAT ACTAAAGAAG AACGATGTCG TACTCTCCCT TGGAAATACA 
ATGCGTAGTG GCTGTGTCCA TGATGTGTGT GATAATCCGC AGATGATGGA GATAAGGACG 
AACGCAAAAC TTGCAAAGCA GGCTAATGAG GCTGGTGTCC AGGTTATCAT CGAGGGCATG 
GGCGGTCATG TGCAGGCGAA TGATATCGTT CCACATATTC AGGCACACCG TGCTCTTTCC 
GATTTCCCTC TCTTTGTGGC AGGGCCATTG CCTACTGATG TTGGTATGGG CTATGATCAC 
ATCTCTGGAG CAGTCGGTGC GAGCATTGCA AGTGGCAATG GTGCTGATTA TCTTTGTTAC 
ATAACTCCGG CAGAACATCT TTCCCTTCCA ACACCTGAGC AAGTGCGTGA AGGCCTTATT 
GCTTTCAAGA TCGCGGCACA TATAGGTGAT TCCATGAAAT ATGGTCTCGA TGAACGGGAC 
AAATTGCTTG CTGACAGGCG TGCCAATTTC GATTGGGAAG GGCAGATGGC ACTGGCACTG 
GACCCTGACA AACCAAAGGG AATGTGTCCC ATGACAGGTC CCTGTTCAAT GTGTGGGGAA 
TATTGTGCCA TCAAGATAAT GGCTGATTAT TTGTCGGAAG GTGTCTGA

Protein sequence

MRPTQVEYAK NGTITPEMEY VAEHESIYVE TVMSRVADGS LVIMVRDGCP PVAIGRGAKT 
KINVNLGTSS ASIDPDAELE KVKIAEKYGA DTITDLSMGG DISAIRKIVF DNTTLPITTV 
PVYQAVVECG MKDTSSDDVL SYLKKQVDEG VSSVVVHCVE KQMLEKLKGT GRIMGMVSKG 
GSFTSVLMLK DGCENPYLEN FDEVLSILKK NDVVLSLGNT MRSGCVHDVC DNPQMMEIRT 
NAKLAKQANE AGVQVIIEGM GGHVQANDIV PHIQAHRALS DFPLFVAGPL PTDVGMGYDH 
ISGAVGASIA SGNGADYLCY ITPAEHLSLP TPEQVREGLI AFKIAAHIGD SMKYGLDERD 
KLLADRRANF DWEGQMALAL DPDKPKGMCP MTGPCSMCGE YCAIKIMADY LSEGV