Gene Mlg_2089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2089
Symbol
ID	4269408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2369069
End bp	2370118
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	65%
IMG OID	638126845
Product	fructose-bisphosphate aldolase
Protein accession	YP_742921
Protein GI	114321238
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1830] DhnA-type fructose-1,6-bisphosphate aldolase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.376807
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGATA TTGAGGCCAT ACTCGGCAAT GAAGCGGAAA CCCTGTTGAA CCATCGCTGC 
GAGGGGATTC GCCGCGAGCA ACTGCAACTG CCGGGCGGCG ACTACATCGA CCGGGTGGTC 
GCCCAGAAGG ACCGTAAACC CGCTGTGCTG CGCAACCTGC AGGCGCTGTT CAACACCGGC 
CGGCTGGCCG GGACCGGGTA CCTCTCGCTG CTGCCGGTGG ACCAGGGCGT GGAGCACTCG 
GCAGGGGCCT CGTTCGCGCC CAACCCGGCC ATGTTCGATC CGGAAAGGAT CGTGCAGCTG 
GGCATCGAGG GCGGCTGCAA CGGCGTGGCC TCCACCCTGG GGGTGCTCTC GTCGGTGGCC 
CGCCGCTACG CCCACCGCAT CCCGTTCATC GTCAAGCTCA ATCACAACGA GCTGCTGACC 
TACCCCAACA TCCACGACCA GACGCTCTTC GCCCAGGTGG AACAGGCCTT CGACATGGGG 
GCGGTGGCGG TGGGCGCCAC CATCTACTAC GGCAGCCCCG AGTGCCGACG CCAGATCCAG 
GAGATCAGCG AGGCCTTCGC CCGCGCCCAC GAACTGGGGC TGTGCACCAT CCTCTGGGCC 
TACCTGCGCA ACAACGACTT CAAAAAGGAC GGCACCGACT ACCACGTCTC CGCCGACCTC 
ACCGGCCAGG CCAACCACCT GGCGGCCACC ATCAACGCCG ACATTGTGAA ACAGAAGCAG 
CCGGAGAATA ACGGCGGTTT CAAGGCACTG GGTTTCGGCA AGACCCACCC CAAGGTCTAC 
GATGAACTGA CCAGTGACCA CCCCATCGAC CTTACCCGCT ATCAGGTGGC CTGCTGTTAC 
ATGGGCCGCG CCGGGCTGAT CAACTCCGGC GGTGCCTCCG GTGAGAACGA CCTGCAGCAG 
GCCGTGCGCA CCGCCGTGAT CAACAAACGC GCCGGCGGCA TGGGGCTGAT CTCCGGACGC 
AAGGCCTTCC AAAAGCCGAC GGACAAGGGG GTGGAGCTGC TGCACGCCAT CCAGGACGTT 
TACCTGGACG ACGCCATCAC GGTGGCCTGA

Protein sequence

MTDIEAILGN EAETLLNHRC EGIRREQLQL PGGDYIDRVV AQKDRKPAVL RNLQALFNTG 
RLAGTGYLSL LPVDQGVEHS AGASFAPNPA MFDPERIVQL GIEGGCNGVA STLGVLSSVA 
RRYAHRIPFI VKLNHNELLT YPNIHDQTLF AQVEQAFDMG AVAVGATIYY GSPECRRQIQ 
EISEAFARAH ELGLCTILWA YLRNNDFKKD GTDYHVSADL TGQANHLAAT INADIVKQKQ 
PENNGGFKAL GFGKTHPKVY DELTSDHPID LTRYQVACCY MGRAGLINSG GASGENDLQQ 
AVRTAVINKR AGGMGLISGR KAFQKPTDKG VELLHAIQDV YLDDAITVA