Gene EcSMS35_0604 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0604
Symbol	fes
ID	6143378
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	613848
End bp	615050
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	55%
IMG OID	641615496
Product	enterobactin/ferric enterobactin esterase
Protein accession	YP_001742702
Protein GI	170681399
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2382] Enterochelin esterase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGCGT TAAAAGTAGG AAGTGAGAGC TGGTGGCAGT CGAAACATGG CCCGGAATGG 
CAACGTCTGA ATGACGAAAT GTTTGAGGTC ACTTTCTGGT GGCGTGATCC ACAAGGTTCT 
GAAGGCCACT CGACGATAAA GCGCGTATGG GTCTATATCA CTGGCATGAC CGATCACCAT 
CAGAACAGCC AGCCCCGGTC GATGCAGCGA ATTGCAGGAA CCGATGTTTG GCAGTGGACG 
ACACAACTCA ATGCCAACTG GCGCGGCAGC TACTGCTTTA TTCCTACCGA ACGCGATGAC 
ATTTTTTCTG CACCATCCCC CGATCGCCTC GAATTACGCG AAGGCTGGCG AAAACTATTA 
CCCCAGGCGA TAGCCGATCC GCTGAATCCA CAAAGCTGGA AAGGCGGGCG AGGGCACGCT 
GTTTCTGCAC TCGAAATGCC GCAAGCGCCT CTGCAACCGG GATGGGATTG TCCGCAAGCG 
CCAGAAACGC CTGCCAAAGA AATTATCTGG AAAAGTGAAC GGTTGAAAAA TTCACGCCGT 
GTATGGATTT TTACCACCGG CGATGCAACA GCAGAAGAAC GCCCGCTGGC AGTTTTGCTT 
GATGGCGAAT TTTGGGCGCA GAGTATGCCC GTCTGGCCTG CGCTGACTTC GCTGACCCAT 
CGTCGGCAAC TTCCGCCCGC CGTGTATGTG TTGATCGACG CTATCGACAC CACGCACCGC 
GCCCACGAAC TGCCGTGTAA TGCGGATTTC TGGCTGGCAG TACAGCAAGA GTTATTACCC 
CAGGTGAAAG CTATTGCCCC TTTTAGCGAT CGCGCCGATC GCACCGTGGT CGCCGGACAG 
AGTTTTGGTG GGCTTTCCGC GCTGTATGCC GGACTGCACT GGCCTGAACG CTTTGGCTGT 
GTATTAAGCC AGTCAGGCTC GTACTGGTGG CCGCATCGGG GCGGGCACCA AGAGGGCATG 
TTACTTGAAC AGCTAAATAC TGGTGAAGTT AGCGCCGAAG GTCTGCGCAT TGTGCTGGAA 
GCGGGTGTTC GCGAGCCGAT GATCATGCAG GCCAATCAGG CGCTGTATGC GCAATTACAC 
CCCCTAAAAG AATCCATTTT CTGGCGTCAG GTTGACGGCG GACATGATGC GCTTTGTTGG 
CGCGGTGGCT TGATGCAGGG GCTAATCGAC CTCTGGCAAC CACTTTTCCA TGACAGGAGT 
TGA

Protein sequence

MTALKVGSES WWQSKHGPEW QRLNDEMFEV TFWWRDPQGS EGHSTIKRVW VYITGMTDHH 
QNSQPRSMQR IAGTDVWQWT TQLNANWRGS YCFIPTERDD IFSAPSPDRL ELREGWRKLL 
PQAIADPLNP QSWKGGRGHA VSALEMPQAP LQPGWDCPQA PETPAKEIIW KSERLKNSRR 
VWIFTTGDAT AEERPLAVLL DGEFWAQSMP VWPALTSLTH RRQLPPAVYV LIDAIDTTHR 
AHELPCNADF WLAVQQELLP QVKAIAPFSD RADRTVVAGQ SFGGLSALYA GLHWPERFGC 
VLSQSGSYWW PHRGGHQEGM LLEQLNTGEV SAEGLRIVLE AGVREPMIMQ ANQALYAQLH 
PLKESIFWRQ VDGGHDALCW RGGLMQGLID LWQPLFHDRS