Gene EcSMS35_4705 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4705
Symbol
ID	6144410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4804667
End bp	4805623
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	50%
IMG OID	641619521
Product	putative sugar ABC transporter, periplasmic sugar-binding protein
Protein accession	YP_001746629
Protein GI	170679669
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGAAAC GCTTACTTGT AGTCTCTGCA GTCTCGGCAG CCATGTCGTC TATGGCGTTG 
GCCGCTCCAT TAACCGTTGG ATTTTCGCAG GTCGGATCGG AATCCGGCTG GCGCGCCGCA 
GAAACCAATG TGGCGAAAAG TGAAGCCGAA AAGCGCGGAA TTACGTTGAA AATTGCCGAT 
GGTCAGCAAA AGCAGGAAAA CCAGATTAAA GCGGTACGTT CCTTCGTCGC GCAAGGGGTG 
GATGCGATCT TTATCGCTCC AGTGGTAGCG ACCGGTTGGG AGCCGGTATT AAAAGAGGCG 
AAAGATGCCG AAATCCCGGT CTTCTTGCTT GACCGTTCCA TCGATGTGAA AGACAAATCT 
CTCTATATGA CCACTGTCAC CGCCGACAAC ATCCTCGAAG GCAAGTTGAT TGGTGACTGG 
CTGGTAAAAG AAGTGAATGG CAAACCATGC AACGTGGTGG AGTTGCAGGG CACCGTTGGA 
GCCAGCGTCG CCATTGACCG TAAGAAAGGC TTTGCCGAAG CCATTAAGAA TGCGCCAAAT 
ATCAAAATTA TCCGCTCGCA GTCAGGTGAC TTCACCCGCA GCAAAGGCAA AGAAGTGATG 
GAGAGCTTTA TCAAAGCGGA AAACAACGGC AAAAACATCT GCATGGTTTA CGCCCATAAC 
GATGACATGG TAATTGGTGC AATTCAGGCA ATTAAAGAAG CGGGCCTGAA ACCGGGCAAA 
GATATCCTGA CAGGCTCTAT CGACGGCGTG CCGGACATCT ACAAAGCGAT GATTGATGGC 
GAAGCGAACG CCAGCGTTGA ACTAACGCCG AATATGGCAG GCCCTGCTTT TGACGCGCTG 
GAGAAATACA AAAAAGACGG CACCATGCCT GAAAAGCTGA CGCTGACCAA GTCCACCCTT 
TACCTGCCTG ATACCGCAAA AGAAGAGTTA GAGAAGAAGA AAAATATGGG GTATTGA

Protein sequence

MWKRLLVVSA VSAAMSSMAL AAPLTVGFSQ VGSESGWRAA ETNVAKSEAE KRGITLKIAD 
GQQKQENQIK AVRSFVAQGV DAIFIAPVVA TGWEPVLKEA KDAEIPVFLL DRSIDVKDKS 
LYMTTVTADN ILEGKLIGDW LVKEVNGKPC NVVELQGTVG ASVAIDRKKG FAEAIKNAPN 
IKIIRSQSGD FTRSKGKEVM ESFIKAENNG KNICMVYAHN DDMVIGAIQA IKEAGLKPGK 
DILTGSIDGV PDIYKAMIDG EANASVELTP NMAGPAFDAL EKYKKDGTMP EKLTLTKSTL 
YLPDTAKEEL EKKKNMGY