Gene Mlg_0380 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0380
Symbol
ID	4269005
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	424206
End bp	425171
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	72%
IMG OID	638125111
Product	thiamine-monophosphate kinase
Protein accession	YP_741225
Protein GI	114319542
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.450658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.175688
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAAT TTCAACTCAT CCGCAGCTAC TTCCAGCCCG ACGCCAGGGG CGAGGGCGTG 
GTGTTGGGGG TGGGTGACGA CGCCGCCCTG CTGCAGCCCG CCCCGGGCCA ACTGCTGGTC 
ACCTGCGTGG ACACCCTGGT GGCCGGCGTG CACTTCCCCG AAGACGCCCC GCCGGACGCC 
GTCGGCCACA AGGCCCTGGC GGTGAACCTC AGCGACCTGG CCGCCATGGG CGCCCGCCCC 
CGCTGGTTCC AGTTGGCGCT CACCCTCCCG GAGATCGACG AGGCCTGGCT GGCGGCCTTC 
TCCAGCGGCC TGCACCGCCT GGCCGCCGAG CAGGACGTGG CCCTGGTCGG CGGCGACACC 
ACCCGCGGGC CCCTCACCAT CACGGTCCAG GCCATGGGCG AGGTGGCGCC CGCGCAGGCA 
TTGCGCCGGA CCGGCGCCCG CGCCGGCGAC CGGCTCTACG TGACCGGCAC CCTGGGTGAT 
GCCGCCCAGG GGCTGGCCCT GTGGCAGCGG GGCGTGCGGT CTGCCGGCGG AGATGACCCG 
GCCGGCTTTC TGATCGACCG GCTGCACCGC CCCACCCCCC GGATGGCCGC AGGCCGCGCG 
GCGGCGGGCC TGGCTCGGGC CGCCATCGAT ATCTCCGACG GCCTGCTCGC GGACCTGGGG 
CACCTGTTGG AAGGTGGCGA AGGGCTGGGG GCCGTGCTGC AGGCCGACAG CCTGCCGCTC 
TCGCCCGCGT ACCGCGCGCA CTGCGAAGAC TCTTTACCGG GGCGGGCGGC CCTGTCCGGG 
GGCGACGACT ACGAGTTGCT GTTTGCGGTG GCCCCCGAGA ACGAGGCGGC ATTCCAAACG 
GCCCTGCAAC ATGTGCCGGC TGGATGCACC TGCATTGGCT GGATCACCGA GGATTCGGCG 
ATTACCCTGC AAGGGGACGG AAAGGCGCAG GTCCTGACCC GCCAGGGGTA TCAGCACTTC 
AACTAG

Protein sequence

MDEFQLIRSY FQPDARGEGV VLGVGDDAAL LQPAPGQLLV TCVDTLVAGV HFPEDAPPDA 
VGHKALAVNL SDLAAMGARP RWFQLALTLP EIDEAWLAAF SSGLHRLAAE QDVALVGGDT 
TRGPLTITVQ AMGEVAPAQA LRRTGARAGD RLYVTGTLGD AAQGLALWQR GVRSAGGDDP 
AGFLIDRLHR PTPRMAAGRA AAGLARAAID ISDGLLADLG HLLEGGEGLG AVLQADSLPL 
SPAYRAHCED SLPGRAALSG GDDYELLFAV APENEAAFQT ALQHVPAGCT CIGWITEDSA 
ITLQGDGKAQ VLTRQGYQHF N