Gene EcSMS35_2700 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2700
Symbol
ID	6144918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2772184
End bp	2773695
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	56%
IMG OID	641617571
Product	putative sugar ABC transporter, ATP-binding protein
Protein accession	YP_001744736
Protein GI	170683588
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCACGG CAACAGAGGC AGTCCCGGTA GCAAAAGTGG TGGCAGGAAA TAAGCGTTAT 
CCCGGCGTCG TTGCGTTGGA TAACGTTAAC TTCACGCTCA ATAAAGGCGA AGTTCGTGCG 
CTGTTAGGCA AAAACGGCGC GGGCAAATCG ACCCTCATTC GAATGCTTAC CGGTAGCGAA 
CGTCCGGATA GCGGTGATAT CTGGATTGGC GAGACGCGAC TGGAAGGTGA CGAAACTACG 
CTGACTCGCC GTGCCGCTGA ACTGGGGGTT CGTGCGGTTT ATCAGGAATT AAGTCTGGTG 
GAAGGGCTGA CGGTGGCGGA AAACCTCTGC CTCGGTCAGT GGCCCCGCCG CAACGGCATG 
ATTGATTACC TGCAAATGGC GCAGGATGCC CAACGTTGCT TACAGGCGCT GGGCGTTGAC 
GTTAGCCCTG AACAACTTGT TTCAACGCTA AGCCCGGCGC AAAAGCAACT GGTGGAAATT 
GCGCGGGTGA TGAAGGGCGA GCCGCGCGTG GTCATTCTTG ATGAACCCAC CAGCTCGCTT 
GCCAGTGCGG AAGTTGAACT GGTGATCAGC GCGGTGAAAA AGATGTCGGC ACTGGGCGTG 
GCGGTGATTT ATGTCAGCCA CCGGATGGAA GAAATTCGCC GCATTGCCTC CTGTGCCACC 
GTTATGCGCG ATGGTCAGGT GGCGGGCGAT GTGATGCTCG AAAACACCTC TACGCATCAT 
ATTGTGTCGC TAATGCTCGG GTGCGATCAC GTTGATATTG CGCCGGTTGC CCCTCAGGAA 
ATTATGGATC AGGCCGTGCT GGAAGTCCGT GCGTTACGCC ATAAGCCCAA GCTGGAGGAT 
ATCAGCTTTA CGCTACGTCG CGGCGAAGTG CTCGGCATTG CTGGCCTGCT GGGGGCAGGG 
CGCAGTGAAT TGTTGAAAGC CATAGTTGGG CTGGAGACGT ATGAACAGGG CGAAATTGTT 
ATCAACGGCG AGAAAATCAC GTGCCCCGAT TACGGCGACA TGCTGAAACG CGGCATTGGA 
TATACGCCAG AAAACCGCAA AGAAGCGGGG ATCATTCCCT GGCTGGGCGT TGACGAAAAT 
ACAGTGCTGA CCAATCGGCA AAAAATCAGC GCCAACGGTG TGCTGCAATG GTCCACCATC 
CGCCGCCTGA CCGAAGAGGT GATGCAGCGG ATGACGGTCA AGGCCGCCAG TAGCGAAACG 
CCCATCGGCA CGCTTTCTGG CGGCAATCAG CAAAAAGTGG TGATCGGTCG TTGGGTCTAT 
GCCGCCAGCC AGATTTTGTT GCTCGACGAG CCAACGCGTG GCGTCGATAT CGAAGCCAAA 
CAGCAGATTT ACCGTATTGT CCGCGAGCTG GCTGCCGAAG GAAAAAGCGT GGTGTTTATC 
TCCAGTGAAG TGGAGGAGTT ACCGTTGGTG TGCGACCGCA TTCTGTTGTT ACAGCACGGT 
ACGTTCTCGC AGGAGTTTCA CTCTCCGGTC AATGTGGATG AGCTGATGTC CGCCATTCTG 
TCTGTGCACT GA

Protein sequence

MFTATEAVPV AKVVAGNKRY PGVVALDNVN FTLNKGEVRA LLGKNGAGKS TLIRMLTGSE 
RPDSGDIWIG ETRLEGDETT LTRRAAELGV RAVYQELSLV EGLTVAENLC LGQWPRRNGM 
IDYLQMAQDA QRCLQALGVD VSPEQLVSTL SPAQKQLVEI ARVMKGEPRV VILDEPTSSL 
ASAEVELVIS AVKKMSALGV AVIYVSHRME EIRRIASCAT VMRDGQVAGD VMLENTSTHH 
IVSLMLGCDH VDIAPVAPQE IMDQAVLEVR ALRHKPKLED ISFTLRRGEV LGIAGLLGAG 
RSELLKAIVG LETYEQGEIV INGEKITCPD YGDMLKRGIG YTPENRKEAG IIPWLGVDEN 
TVLTNRQKIS ANGVLQWSTI RRLTEEVMQR MTVKAASSET PIGTLSGGNQ QKVVIGRWVY 
AASQILLLDE PTRGVDIEAK QQIYRIVREL AAEGKSVVFI SSEVEELPLV CDRILLLQHG 
TFSQEFHSPV NVDELMSAIL SVH