Gene EcSMS35_1948 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1948
Symbol
ID	6146161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1969436
End bp	1970416
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	55%
IMG OID	641616824
Product	iron(III) ABC transporter, permease protein
Protein accession	YP_001744000
Protein GI	170680346
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0609] ABC-type Fe3+-siderophore transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0628531
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAACCG TAAACGGATG TATTTTGCTG CTGGCAGCTA TCAGTATCAC TTTTGCCGCC 
GTAAGTGGGG CTTATCATCT CGATATGCAG CAACTGCTGG CGCTCATTCT TCGTCAAGAA 
AATGTTCCTG TGCAGGAACA AATTGTCTTC TGGCAAATCC GCGTGCCGCG TATTCTTGCT 
GCGCTGTTTC TGGGCGCGGC GCTGGCAGGG GCTGGAACCA CCTATCAGGG AATGTTCCGT 
AATCCCTTAG TGTCACCGGA TATTTTAGGC GTCTCCGCCG GTGCCGGACT TGGTGCCTGC 
GCGGCAATCC TGTGGGGATT ATCCATTGTT TACATCCAGC TGTACGCATT TTGCGGCGGG 
CTGATGGTGG TCGCGGGCGT CTGGTTGATT ACGCGTCGGG TGACCCGCCA CGATCCGATC 
TTAACCCTGG TGCTGGTAGG TATTGCGTTA GGCACGTTGT GCGGAGCGGG GATATCGCTA 
ATAAAAACGC TGGCCGATCC TTACACCCAG TTACCGTCAA TTACCTTCTG GTTGCTGGGG 
GGGCTGTCCA CCGTGACCTT ACGCGATCTC TGCTATGCTG CACCGATCAT TCTCATAGGC 
TCCTTGCCCC TGTTTTTTCT CCGCTGGCGC ATGAATTTAC TCACACTTTC CGACGACGAA 
GCCCGTTCGC TGGGACTGAA CGTGACACGT CTGCGCTTTG GATTGATTGT CTGCGCCACA 
CTCATCACCG CCAGCACGGT AGCAATAGCG GGCATAATTG GTTGGGTCGG CCTGGTCGTT 
CCGCACATTG CCCGCTTGTT GACCGGTCAT AACCATCAGC AGCTGTTGCC CATGGCAATG 
TGTACTGGCG CGATTCTGCT CCTGCTTACC GATACGCTGG CACGCAGCAT TGGAACAACA 
GAAATCCCAC TTGGCATTCT GACCGCTTTT GTTGGCGCAC CGTTTTTCCT GTTTTTGTTG 
TTACGCGGAG GTCGCCAGTG A

Protein sequence

MRTVNGCILL LAAISITFAA VSGAYHLDMQ QLLALILRQE NVPVQEQIVF WQIRVPRILA 
ALFLGAALAG AGTTYQGMFR NPLVSPDILG VSAGAGLGAC AAILWGLSIV YIQLYAFCGG 
LMVVAGVWLI TRRVTRHDPI LTLVLVGIAL GTLCGAGISL IKTLADPYTQ LPSITFWLLG 
GLSTVTLRDL CYAAPIILIG SLPLFFLRWR MNLLTLSDDE ARSLGLNVTR LRFGLIVCAT 
LITASTVAIA GIIGWVGLVV PHIARLLTGH NHQQLLPMAM CTGAILLLLT DTLARSIGTT 
EIPLGILTAF VGAPFFLFLL LRGGRQ