Gene Mlg_2840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2840
Symbol
ID	4270884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	3225417
End bp	3226427
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	67%
IMG OID	638127602
Product	glyceraldehyde-3-phosphate dehydrogenase
Protein accession	YP_743670
Protein GI	114321987
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01532] D-erythrose-4-phosphate dehydrogenase [TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGATCA AAGTTGCAAT CAACGGTTAC GGGCGCATTG GCCGCAACGT GCTCCGCGCC 
CTTTACGAAG CCGGCCGCAC GGACGAGATC CAGGTGGTGG CCATCAACGA CCTGGGCAAC 
GCCGAGACCA ATGCCCACCT CACCCGCTTC GACAGCGTTC ACGGCCGCTT CAACGGCGAG 
GTGCAGGTGG AGGGCGACAG CATGATCGTC AATGGTGACC GGGTGCGGGT GCTCGCGGAG 
CGGGATCCGG CCCGGCTGCC CTGGGGCGAG CTGGGCGTGG ACCTGGTGAT GGAGTGCACC 
GGGCTGTTCA CCACCCGGGA GAAGGCCAGC GCCCACCTGC AGGCCGGCGC CAAGAAGGTG 
CTGATTTCCG CCCCCGGCGG TAAGGACGTG GACAACACCG TGGTCTTCGG CGTCAACCAC 
GACACCCTCA CGCCCGAGCA CACCGTGGTC TCCAACGCCT CCTGCACCAC CAACTGCCTG 
GCCCCGCTGG TCAAGCCGCT GCACGAGGCT ATCGGTGTGG AGCGTGGCCT GATGACCACC 
ATTCACGCCT ACACCAACGA CCAGGTCCTC AACGACGTCC ACCATAAGGA CCTGCGCCGG 
GCCCGTTCCG CCACCATGAG CCAGATCCCG ACCAGCACCG GCGCCGCCGC TGCCGTCGGC 
CTGGTACTGC CGGAGCTGAA CGGCAAGCTG GACGGCTATG CGATCCGCGT GCCCACGGTG 
AACGTCTCCA TCGTGGACCT GACCTTCACC GCCGCCCGCG AGACCTCGGT GGAGGAGATC 
AACCAGATCG TGCGTGGTGC CGCCGAGGGG CCGCTGAAGG GCATCCTCGC CTACAACGAC 
GCCCCGCTGG TCTCCATCGA CTTCAACCAC GACCCGGCCT CCAGCACCTA CGATGCCAGC 
CTGACCAAGG TCAACGGCAA CCTGGTGAAG GTCACGGCCT GGTACGACAA CGAGTGGGGC 
TTCTCCAACC GCATGCTGGA TACCGCCCTG GCCATGGCCC AGGCCGGCTG A

Protein sequence

MAIKVAINGY GRIGRNVLRA LYEAGRTDEI QVVAINDLGN AETNAHLTRF DSVHGRFNGE 
VQVEGDSMIV NGDRVRVLAE RDPARLPWGE LGVDLVMECT GLFTTREKAS AHLQAGAKKV 
LISAPGGKDV DNTVVFGVNH DTLTPEHTVV SNASCTTNCL APLVKPLHEA IGVERGLMTT 
IHAYTNDQVL NDVHHKDLRR ARSATMSQIP TSTGAAAAVG LVLPELNGKL DGYAIRVPTV 
NVSIVDLTFT AARETSVEEI NQIVRGAAEG PLKGILAYND APLVSIDFNH DPASSTYDAS 
LTKVNGNLVK VTAWYDNEWG FSNRMLDTAL AMAQAG