Gene EcHS_A2389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2389
Symbol
ID	5592442
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2400996
End bp	2402213
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	52%
IMG OID	640921516
Product	mandelate racemase/muconate lactonizing enzyme family protein
Protein accession	YP_001459050
Protein GI	157161732
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGAACA TCATGACCCT ACCAAAAATT AAACAGGTTC GCGCCTGGTT TACTGGCGGT 
GCGACAGCAG AAAAAGGCGC TGGCGGCGGT GATTATCACG ACCAGGGGGC GAATCACTGG 
ATAGACGATC ATATTGCCAC CCCGATGAGT AAATACCGCG ATTACGAGCA GTCACGCCAG 
TCATTTGGCA TTAACGTTCT TGGCACGTTG GTTGTTGAAG TCGAAGCAGA AAACGGCCAG 
ACCGGATTCG CCGTTTCGAC AGCCGGTGAA ATGGGCTGTT TTATTGTCGA AAAACATCTT 
AACCGTTTCA TTGAGGGTAA ATGTGTCAGT GATATCAAAC TGATCCACGA TCAAATGCTC 
AGTGCCACCC TGTATTACTC CGGCTCTGGT GGCCTGGTGA TGAATACGAT TTCCTGTGTC 
GATCTGGCTC TGTGGGATCT GTTCGGCAAA GTGGTCGGGC TTCCGGTTTA TAAACTTTTA 
GGCGGCGCTG TTCGTGATGA GATTCAGTTC TACGCCACAG GTGCGCGTCC GGATCTGGCA 
AAAGAGATGG GCTTTATCGG TGGCAAAATG CCGACGCACT GGGGGCCACA TGATGGCGAT 
GCGGGGATCC GCAAAGATGC CGCTATGGTC GCGGATATGC GTGAAAAATG CGGTGAGGAT 
TTCTGGTTAA TGCTCGACTG CTGGATGAGT CAGGACGTGA ACTATGCGAC CAAACTGGCC 
CACGCTTGCG CGCCCTATAA CCTGAAATGG ATCGAAGAGT GCCTGCCGCC ACAGCAGTAT 
GAAGGTTATC GCGAACTGAA ACGCAACGCG CCAGTCGGAA TGATGGTCAC CAGCGGTGAG 
CACCACGGCA CACTGCAATC TTTTCGTACG CTTTCAGAAA CCGGTATCGA CATTATGCAG 
CCGGATGTTG GCTGGTGCGG TGGTTTAACC ACGCTGGTGG AAATTGCCGC AATCGCCAAA 
TCCAGGGGGC AACTGGTGGT GCCGCACGGT TCGTCTGTTT ACTCTCACCA TGCGGTGATC 
ACCTTCACCA ATACGCCATT CAGCGAATTC CTGATGACCA GCCCGGATTG TTCAACGATG 
CGTCCGCAGT TTGACCCGAT TCTGCTCAAT GAGCCGGTTC CGGTGAATGG TCGTATTCAT 
AAATCAGTGC TTGATAAACC CGGTTTTGGC GTCGAACTCA ATCGTGACTG CAATTTGAAA 
CGCCCCTACA GCCACTAA

Protein sequence

MENIMTLPKI KQVRAWFTGG ATAEKGAGGG DYHDQGANHW IDDHIATPMS KYRDYEQSRQ 
SFGINVLGTL VVEVEAENGQ TGFAVSTAGE MGCFIVEKHL NRFIEGKCVS DIKLIHDQML 
SATLYYSGSG GLVMNTISCV DLALWDLFGK VVGLPVYKLL GGAVRDEIQF YATGARPDLA 
KEMGFIGGKM PTHWGPHDGD AGIRKDAAMV ADMREKCGED FWLMLDCWMS QDVNYATKLA 
HACAPYNLKW IEECLPPQQY EGYRELKRNA PVGMMVTSGE HHGTLQSFRT LSETGIDIMQ 
PDVGWCGGLT TLVEIAAIAK SRGQLVVPHG SSVYSHHAVI TFTNTPFSEF LMTSPDCSTM 
RPQFDPILLN EPVPVNGRIH KSVLDKPGFG VELNRDCNLK RPYSH