Gene EcolC_3052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3052
Symbol
ID	6066124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3332726
End bp	3333682
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	55%
IMG OID	641602468
Product	iron-enterobactin transporter periplasmic binding protein
Protein accession	YP_001726003
Protein GI	170021049
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4592] ABC-type Fe2+-enterobactin transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGACTCG CCCCGCTCTA CCGCAACGCC CTTCTATTAA CAGGACTTTT GCTTTCAGGA 
ATAGCCGCAG TTCAGGCCGC TGACTGGCCG CGTCAGATTA CTGACAGCCG TGGCACACAT 
ACACTGGAAA GCCAGCCGCA GCGTATTGTT TCCACCAGCG TCACCCTGAC CGGCTCACTG 
CTGGCGATTG ATGCTCCGGT GATCGCCAGC GGCGCGACCA CGCCGAATAA CCGCGTCGCG 
GATGACCAGG GCTTTTTACG CCAGTGGAGC AAGGTGGCGA AAGAACGCAA ACTGCAACGG 
CTCTATATCG GCGAACCGAG CGCCGAAGCC GTTGCCGCGC AAATGCCGGA TCTGATTTTA 
ATTAGCGCAA CCGGCGGGGA TTCGGCGCTG GCACTGTATG ATCAGCTTTC CACCATCGCC 
CCGACATTAA TCATCAATTA CGACGACAAA AGCTGGCAGT CGCTGTTAAC GCAACTTGGC 
GAAATTACCG GGCATGAGAA ACAAGCGGCA GAGCGGATTG CGCAGTTTGA TAAGCAACTG 
GCGGCGGCGA AAGAGCAAAT CAAATTACCG CCGCAGCCGG TCACTGCCAT TGTCTATACT 
GCCGCTGCAC ACAGTGCCAA TCTCTGGACG CCAGAATCAG CACAAGGGCA GATGCTGGAA 
CAACTCGGCT TTACGCTGGC GAAGTTACCC GCAGGGTTAA ATGCCAGCCA AAGTCAGGGT 
AAACGCCATG ACATCATTCA GCTTGGTGGG GAAAATCTGG CTGCAGGGTT AAATGGCGAG 
TCACTATTCC TGTTCGCCGG TGATCAGAAA GATGCCGATG CTATTTATGC TAATCCGCTG 
CTCGCGCACC TGCCTGCAGT ACAAAACAAG CAGGTTTATG CGCTGGGAAC CGAGACGTTC 
CGTCTGGATT ACTACAGCGC CATGCAAGTG CTGGATAGGC TTAAGGCGCT GTTTTAA

Protein sequence

MRLAPLYRNA LLLTGLLLSG IAAVQAADWP RQITDSRGTH TLESQPQRIV STSVTLTGSL 
LAIDAPVIAS GATTPNNRVA DDQGFLRQWS KVAKERKLQR LYIGEPSAEA VAAQMPDLIL 
ISATGGDSAL ALYDQLSTIA PTLIINYDDK SWQSLLTQLG EITGHEKQAA ERIAQFDKQL 
AAAKEQIKLP PQPVTAIVYT AAAHSANLWT PESAQGQMLE QLGFTLAKLP AGLNASQSQG 
KRHDIIQLGG ENLAAGLNGE SLFLFAGDQK DADAIYANPL LAHLPAVQNK QVYALGTETF 
RLDYYSAMQV LDRLKALF