Gene EcSMS35_3808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3808
Symbol
ID	6143448
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3874090
End bp	3875082
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	53%
IMG OID	641618634
Product	iron chelate ABC transporter permease
Protein accession	YP_001745774
Protein GI	170682306
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0609] ABC-type Fe3+-siderophore transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.0360927
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTCAAGG ATTCACTCTC TTCCGCCAGG GTCTTTATGG GGCTATCACT ATTATTGCTC 
GCTCTGGTGC TGTTTGGTGC CAGTCAGGGA GCGTTAAAGA TCAGTTTTGA TGCCCTTTTT 
GATGAGGAAT ACCGCGATAT CTGGCTCAAT ATTCGTCTAC CAAGGGTTTT GCTGGCGGTG 
CTGGTAGGTG CAGCGTTGGC AACCGCAGGG GTAATTATGC AAGGGCTTTT TCGCAACCCA 
ATGGCTGACC CTGGATTACT TGGCGTCAGT AGCGGTTCTG CATTAATGGT TGGCGTTGCT 
ATTGTGCTGC CCTTCTCCTT CCCAGTGGTG CTGGTGCTCT ATGAGCAAAT GGTGTTTGCC 
ATTGCCGGAA GTTTAGTGGT CTGCACCATC ATTTTTCTCA TCACGCAGCG CCATCGCGAT 
GGCAGCATGA TGCAATTATT ACTCGCCGGT ATCGCCATCA ATGCCCTGTG CGGCGCAGCG 
ATCGGCATCC TGAGCTATAT CGGCGATGAG CAGCAGCTAC GACAACTCAC ATTGTGGATG 
ATGGGCAATC TTGGACAGGC GCAATGGCCG ACGTTATTGG TTGCCAGTTC ATTCATCCTA 
CCGGCCATTA TCGCAACAAC TTGTCTCGCC GGAACGCTGA ATTTACTGCA GCTCGGTGAT 
GAAGAAGCCC ACTACCTCGG CGTGAACGTT AAGCGTAAAC GCCAGCAATT ACTGTTAGTG 
AGCTCACTGC TCGTTGGTGC CGCCGTATCG GTAAGCGGCA TTATCGGCTT TATTGGCCTG 
GTGATCCCGC ATCTGATTCG CATGACTACC GGGGCAAATC ACCGCTGGCT AATCCCTTGT 
TCCGCCCTCG CCGGAGCCTG TTTATTGCTG ATGGCAGACA CGCTTGCCCG CACGCTGGTA 
CAGCCAGCAG AAATGCCCGT GGGATTATTA ACCAGCCTGC TTGGTGGCCC TTATTTTATG 
TGGTTGATTC TGCGCAACCG GAGGATCACA TGA

Protein sequence

MLKDSLSSAR VFMGLSLLLL ALVLFGASQG ALKISFDALF DEEYRDIWLN IRLPRVLLAV 
LVGAALATAG VIMQGLFRNP MADPGLLGVS SGSALMVGVA IVLPFSFPVV LVLYEQMVFA 
IAGSLVVCTI IFLITQRHRD GSMMQLLLAG IAINALCGAA IGILSYIGDE QQLRQLTLWM 
MGNLGQAQWP TLLVASSFIL PAIIATTCLA GTLNLLQLGD EEAHYLGVNV KRKRQQLLLV 
SSLLVGAAVS VSGIIGFIGL VIPHLIRMTT GANHRWLIPC SALAGACLLL MADTLARTLV 
QPAEMPVGLL TSLLGGPYFM WLILRNRRIT