Gene EcSMS35_2400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2400
Symbol
ID	6145913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2448243
End bp	2449532
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	53%
IMG OID	641617273
Product	major facilitator transporter
Protein accession	YP_001744445
Protein GI	170682702
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCG CTTTGCTTGA CGCCGTGGTG AAGAAAAACC GCGCGCGTTT AATTCCGTTT 
ATGTTGGCGC TGTATGTGCT GGCGTTTCTC GACCGTTCGA ATATTGGTTT TGCCAAACAG 
ACCTACCAGA TTGATACCGG GCTGAGTAAT GAAGCTTATG CGCTGGGAGC AGGCATTTTC 
TTTGTGGTAT ACGCGTTTCT GGGGGTTCCG GCGAATCTTT TGATGCGCAA ACTGGGGGCA 
AGAACCTGGA TTGGTACGAC AACACTGCTG TGGGGATTTC TTTCGGCTGC CATGGCATGG 
GCCGATACTG AAGCGAAATT TCTGATTGTT CGCACTCTGC TTGGTGCTGC GGAGGCTGGG 
TTTTTCCCTG GTATGATTTA TCTCACCTCG CAATGGTTTC CGCAGCGTAA TCGCGCCAGC 
ATTATGGGGC TGTTCTATAT GGGCGCACCG CTGGCGTTAA CACTGGGATC ACCGCTTTCT 
GGCGCGCTGC TGGAGATGCA TGGATTTATG GGGCATCCCG GCTGGTTCTG GATGTTTGTT 
ATTGAAGGAT TGTTGGCAGT CGGCGCTGGG GTATTCACAT TCTTTTGGCT TGATGACACA 
CCGGAGCAGG CACGTTTTCT GAGTAAAGAA GAAAAAACGT TGCTTATCAA CCAACTGGCA 
AGTGAAGAAC AACAGAAAGT GACTTCCCGA CTGAGCGATG CGCTGCGTAA TGGGCGAGTC 
TGGCAACTGG CGATTATCTA CCTGACCATT CAGGTAGCGG TTTACGGATT AATTTTCTTC 
CTGCCGACCC AGGTTGCTGC ATTGCTGGGG ACAAAAGTGG GCTTTACGGC GTCGGTGGTC 
ACCGCCATTC CGTGGGTTGC GGCCTTGTTT GGAACCTGGC TTATTCCGCG CTATTCCGAT 
AAAACCGGCG AACGGCGTAA TGTCGCAGCG CTGACATTAC TGGCGGCGGG CATTGGTATT 
GGTCTGTCCG GGCTGCTTTC TCCAGTACTG GCGATCGTAG CGCTGTGTGT TGCAGCCATC 
GGGTTTATTG CCGTGCAGCC GGTGTTCTGG ACGATGCCGA CACAACTGCT TTCCGGTACG 
GCGCTGGCTG CGGGGATTGG TTTTGTAAAC CTGTTTGGTG CAGTGGGCGG GTTTATTGCC 
CCGATCCTGC GCGTGAAAGC AGAAACGTTA TTTTCCAGCG ATGCGGCGGG ATTACTGACG 
CTGGCAGCGG TGGCGGTCAT CGGTTCGCTG ATTATTTTCA CTCTGCGTGT AAATCGCACT 
GTTGCGCAGA CCGACGTGGC ACATCATTAA

Protein sequence

MSTALLDAVV KKNRARLIPF MLALYVLAFL DRSNIGFAKQ TYQIDTGLSN EAYALGAGIF 
FVVYAFLGVP ANLLMRKLGA RTWIGTTTLL WGFLSAAMAW ADTEAKFLIV RTLLGAAEAG 
FFPGMIYLTS QWFPQRNRAS IMGLFYMGAP LALTLGSPLS GALLEMHGFM GHPGWFWMFV 
IEGLLAVGAG VFTFFWLDDT PEQARFLSKE EKTLLINQLA SEEQQKVTSR LSDALRNGRV 
WQLAIIYLTI QVAVYGLIFF LPTQVAALLG TKVGFTASVV TAIPWVAALF GTWLIPRYSD 
KTGERRNVAA LTLLAAGIGI GLSGLLSPVL AIVALCVAAI GFIAVQPVFW TMPTQLLSGT 
ALAAGIGFVN LFGAVGGFIA PILRVKAETL FSSDAAGLLT LAAVAVIGSL IIFTLRVNRT 
VAQTDVAHH