Gene EcHS_A0634 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0634
Symbol	fes
ID	5593707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	648896
End bp	650020
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	55%
IMG OID	640919815
Product	enterobactin/ferric enterobactin esterase
Protein accession	YP_001457397
Protein GI	157160079
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2382] Enterochelin esterase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	78
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGAGG TCACTTTCTG GTGGCGTGAT CCCCAAGGTT CTGAAGAATA CTCGACGATA 
AAGCGCGTAT GGGTCTACAT CACTGGTGTG ACCGATCACC ATCAGAACAG CCAGCCCCAG 
TCGATGCAGC GAATTGCAGG CACTAACGTC TGGCAGTGGA AGACACAACT CAATGCCAAC 
TGGCGCGGCA GCTACTGCTT TATTCCCACC GAACGCGATG ACATTTTTTC TGTACCATCC 
CCCGATCGCC TCGAATTGCG CGAAGGCTGG CGAAAACTAT TACCCCAGGC GATAGCCGAT 
CCGCTGAACC TACAAAGCTG GAAAGGCGGG CGAGGGCACG CTGTTTCTGC ACTCGAAATG 
CCGCAAGCGC CTCTGCAACC GGGATGGGAT TGTCCGCAAG CGCCAGAAAT ACCTGCCAAA 
GAAATTATCT GGAAAAGTGA ACGGTTGAAA AAGTCACGGC GTGTATGGAT TTTTACCACC 
GGCGATGCAA CAGCAGAAGA ACGCCCGCTG GCAGTTTTGC TCGATGGCGA ATTTTGGGCG 
CAAAGTATGC CCGTCTGGCC AGTGCTGACT TCGCTGACCC ATCGTCAGCA ACTTCCTCCC 
GCCGTGTATG TGTTGATCGA CGCTATCGAC ACCACGCACC GCGCCCACGA ACTGCCGTGT 
AATGCGGATT TCTGGCTCGC AGTACAGCAA GAGTTATTAC CCCTGGTGAA AGCTATTGCC 
CCTTTTAGCG ATCGTGCCGA TCGCACCGTG GTTGCCGGGC AGAGTTTTGG TGGGCTTTCC 
GCGCTGTATG CCGGACTGCA CTGGCCTGAA CGCTTTGGCT GTGTATTAAG CCAGTCAGGA 
TCGTACTGGT GGCCGCATCG GGGCGGGCAG CAAGAGGGCG TGTTACTTGA AAAGCTAAAA 
GCTGGTGAAG TTAGCGCCGA AGGTCTGCGC ATTGTGCTGG AAGCGGGTAT TCGCGAGCCG 
ATGATCATGC GGGCCAATCA GGCGCTGTAT GCGCAATTAC ACCCCATAAA AGAATCCATT 
TTCTGGCGTC AGGTTGACGG CGGACATGAT GCGCTTTGTT GGCGCGGTGG CTTGATGCAG 
GGGCTAATCG ACCTCTGGCA ACCACTTTTC CATGACAGGA GTTGA

Protein sequence

MFEVTFWWRD PQGSEEYSTI KRVWVYITGV TDHHQNSQPQ SMQRIAGTNV WQWKTQLNAN 
WRGSYCFIPT ERDDIFSVPS PDRLELREGW RKLLPQAIAD PLNLQSWKGG RGHAVSALEM 
PQAPLQPGWD CPQAPEIPAK EIIWKSERLK KSRRVWIFTT GDATAEERPL AVLLDGEFWA 
QSMPVWPVLT SLTHRQQLPP AVYVLIDAID TTHRAHELPC NADFWLAVQQ ELLPLVKAIA 
PFSDRADRTV VAGQSFGGLS ALYAGLHWPE RFGCVLSQSG SYWWPHRGGQ QEGVLLEKLK 
AGEVSAEGLR IVLEAGIREP MIMRANQALY AQLHPIKESI FWRQVDGGHD ALCWRGGLMQ 
GLIDLWQPLF HDRS