Gene EcSMS35_1947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1947
Symbol
ID	6146065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1968414
End bp	1969436
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	54%
IMG OID	641616823
Product	iron(III) ABC transporter, periplasmic iron(III)-binding protein
Protein accession	YP_001743999
Protein GI	170681965
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0614] ABC-type Fe3+-hydroxamate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.0791434
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACTAA CCAGACGGAG GTTTACACAG ATTCTTGCGT CGACATTGTT CCTGCATCAT 
CTGCCGTCCT TTGCACAATC AGTCAAATTC TGGTCCTCAC TGACGCTTCC CGAAGCCCAA 
AACATTACAC GCATCGTCAG CGCAGGCGCG CCCGCCGATT TACTATTGCT GGCTGTCGCG 
CCAGAAAAAA TGGTCGGTTT TTCCTCTTTT GATTTTGCCC GTCAGGCATT AATTCCATTG 
CCAGAGCACA TTCGCCAGTT CCCCAGGCTG GGACGACTCG CCGGGCGCGC CAGCACACTC 
TCGCTGGAAG GGCTTATGGC GTTACATCCC GATTTGGTCG TTGATTGCGG CAATACGGAT 
GAAACCTGGA TCTCCCAGGC ACGGCAGGTT AGCGAACAGA CACAAATACC CTGGTTATTG 
CTTAACGGGA AACTGGAACA ATCAGCAGAA CAGTTAACAA CGCTTGGCAA AACGTTAGGC 
GAAGAGCACC GCGCCGCAGA ACAAGCCAAT CTCGCCAGCC GCTTCGTTGG TGAAGCTCAG 
GCATTCGCCA CCTCACCCGC CGCTAACCTC AGCTTTTATG CTGCGCGCGG TCCTCGAGGG 
CTGGAAACGG GCTTACAGGG TTCGTTGCAT ACCGAGGCGG CGGAATTATT AGGTTTGCAC 
AACGTCGCGC AAATAGCCGA TCGCCACGGT CTGACACAGG TTTCCATGGA AAATCTCCTG 
CGCTGGCAGC CGGATATTAT TCTGGTTCAG GAGGCCGTTA CTGCAGATTT TATTCGTCGT 
GATCCTCTCT GGCAGGGCGT GAAAGCGGTT GCGGAACAAC GCATCTTATT TTTAAGTGGC 
CTGCCCTTTG GCTGGCTGGA TGCCCCGCCG GGAATCAACC GTCTTCTGGG ATTACGCAGA 
CTTCACGCCT GGCTGGATCC CGCCATCAAT CGCCAGTTTA AAAGTGACAT GCAGCATTAC 
GCCCAACTGT TCTGGCATTG TTCACTCAGT GACGCCGACT ATCAAAAATT GGTGGCGAGC 
TAA

Protein sequence

MSLTRRRFTQ ILASTLFLHH LPSFAQSVKF WSSLTLPEAQ NITRIVSAGA PADLLLLAVA 
PEKMVGFSSF DFARQALIPL PEHIRQFPRL GRLAGRASTL SLEGLMALHP DLVVDCGNTD 
ETWISQARQV SEQTQIPWLL LNGKLEQSAE QLTTLGKTLG EEHRAAEQAN LASRFVGEAQ 
AFATSPAANL SFYAARGPRG LETGLQGSLH TEAAELLGLH NVAQIADRHG LTQVSMENLL 
RWQPDIILVQ EAVTADFIRR DPLWQGVKAV AEQRILFLSG LPFGWLDAPP GINRLLGLRR 
LHAWLDPAIN RQFKSDMQHY AQLFWHCSLS DADYQKLVAS