Gene Mlg_1594 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1594
Symbol
ID	4268565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1823720
End bp	1824847
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	71%
IMG OID	638126351
Product	enoyl-CoA hydratase/isomerase
Protein accession	YP_742431
Protein GI	114320748
COG category	[I] Lipid transport and metabolism
COG ID	[COG1024] Enoyl-CoA hydratase/carnithine racemase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGAGC AACAGGCCGC CTTCCAAGCG CAGGTGTTAC CGGCCCGCGA TGACGGGCCT 
GGCATCGGGG TGGCCACCCT CACCGCCCCG CGTAAGCTCA ACGCCCTGGA CCTGGGCATG 
ATTCAAGCCC TGAGCCGGCA ATTGGAGGCC TGGGCCCGCG ATCCGGCGGT GGCCTGTGTG 
GTCCTGGAGG GCGAGGGGGA ACGGGCCTTC TGCGCGGGCG GTGACGTACG CGCCGTGGCC 
GAGGCCCTGC GCGGCAACCG CCCGGCGGGA CTGGCCTTCG CCGAGCAGTA TTTCAGCGCA 
GAGTACCGCC TGGATCACCA ACTGCACGTC TACCCCAAGC CATTGCTGGT GCGGGGACAG 
GGTGTGGTCA TGGGCGGCGG ACTGGGCCTG TTCCAGGGCG GCGACGTGCG CGTGCTCACC 
CCCACGTCCA CCCTGGCCAT GCCCGAGATC ACCATCGGTC TCTTCCCCGA CGTCGGGGCC 
GCGTGGTTCC TGCAGCGCAC CCCACCCGGG ACCGGCGAAT ACGCCGCCTT GACCGGCGCC 
CGGCTCAACG CCGCAGACGC CCTCTTCATG GGCCTGGGCG ACCTGGTCCT GCCCGAGGAT 
CACCGGGGGG CGCTGCTGGA GGCACTCCAG GCCGTACGCT GGCACAACGA GCCCCGCCGT 
GACCGGAGCC TGCTCCACCA AGCCGCGCGC GGGCTGGCGA TCCCCCGACC GGAGCTATCC 
GACTCGCCCG TTCAGGCCCG GGCCGAGCGC ATCCGTCAGG TCATGGCCTG GCCCGGCCTG 
GGCCAACGGG TGGCCGCCAT CCGCGACTCG GCCCGCCACG ACCCCTGGCT GGAGGAGAAC 
GCCGAACGCT TCGAGAGCGG CTCGCCGACA TCCATTGCCC TGATCCACGA GCAATTCCAG 
CGCACGCGGC ACCTAGCCCT GCGCGAGTGC TTCCAGCTCG ACCTGGTCCT GGCCATCCAG 
TGCTCCCGGC GGGATGACTT CCCCGAAGGG GTGCGCGCCC TGCTGCTGGA CAAGGACCAG 
AACCCCCAGT GGCAGTCCGC CACCCTGAGG GAGATCACCC CGGACTGGAT CGACGCCCAC 
TTCGTCTCCC CCTGGCCCGA CCAGCCCAAC CCGCTGCTGG ACCTCTGA

Protein sequence

MAEQQAAFQA QVLPARDDGP GIGVATLTAP RKLNALDLGM IQALSRQLEA WARDPAVACV 
VLEGEGERAF CAGGDVRAVA EALRGNRPAG LAFAEQYFSA EYRLDHQLHV YPKPLLVRGQ 
GVVMGGGLGL FQGGDVRVLT PTSTLAMPEI TIGLFPDVGA AWFLQRTPPG TGEYAALTGA 
RLNAADALFM GLGDLVLPED HRGALLEALQ AVRWHNEPRR DRSLLHQAAR GLAIPRPELS 
DSPVQARAER IRQVMAWPGL GQRVAAIRDS ARHDPWLEEN AERFESGSPT SIALIHEQFQ 
RTRHLALREC FQLDLVLAIQ CSRRDDFPEG VRALLLDKDQ NPQWQSATLR EITPDWIDAH 
FVSPWPDQPN PLLDL