Gene EcSMS35_3732 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3732
Symbol	ugpB
ID	6146056
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3801431
End bp	3802747
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	53%
IMG OID	641618558
Product	glycerol-3-phosphate transporter periplasmic binding protein
Protein accession	YP_001745698
Protein GI	170680964
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCGT TACGTTATAC AGCTTCAGCA CTGGCGCTCG GACTGGCTTT AATGGCAAAT 
GCGCAGGCAG CGACGACCAT TCCGTTCTGG CATTCTATGG AAGGGGAACT GGGTAAAGAG 
GTGGATTCTC TGGCCCAACG TTTTAACGCC GAAAACCCGG ATTACAAAAT TGTACCGACC 
TATAAAGGCA ACTACGAACA GAATTTAAGC GCGGGGATTG CCGCATTTCG TACCGGCAAC 
GCTCCGGCTA TTTTGCAGGT TTATGAAGTT GGCACCGCCA CCATGATGGC GTCGAAAGCC 
ATTAAACCGG TATATGACGT GTTTAAAGAG GCGGGGATTC AGTTCGATGA GTCGCAGTTT 
GTGCCGACGG TTTCAGGCTA CTACTCCGAC AGCAAAACTG GGCACTTACT CTCCCAGCCG 
TTCAACAGCT CGACTCCCGT TCTCTATTAC AACAAAGACG CCTTCAAGAA AGCCGGTTTA 
GACCCGGAAC AGCCGCCGAA AACCTGGCAG GATCTGGCGG ACTATGCCGC GAAACTGAAA 
GCCTCCGGTA TGAAGTGCGG CTACGCCAGC GGCTGGCAGG GCTGGATCCA ACTGGAAAAC 
TTTAGCGCCT GGAACGGTCT GCCGTTTGCC AGCAAAAACA ACGGCTTTGA CGGCACAGAC 
GCGGTGCTGG AGTTCAACAA GCCGGAGCAG GTGAAACACA TCGCTATGCT CGAAGAGATG 
AACAAGAAGG GCGATTTCAG CTACGTCGGG CGTAAGGATG AATCCACCGA GAAGTTCTAT 
AACGGTGATT GCGCGATGAC GACCGCCTCT TCCGGTTCTC TTGCCAACAT TCGCGAGTAC 
GCCAAATTTA ACTATGGCGT AGGCATGATG CCTTACGATG CCGATGCGAA AGACGCGCCG 
CAAAACGCCA TTATCGGCGG AGCCAGTCTA TGGGTAATGC AGGGTAAAGA TAAAGAAACC 
TACACCGGCG TGGCGAAGTT CCTCGACTTC CTCGCAAAGC CAGAAAACGC TGCCGAGTGG 
CATCAGAAAA CCGGCTATCT GCCAATCACT AAAGCGGCGT ATGACCTGAC CCGTGAGCAG 
GGCTTTTACG AGAAAAACCC AGGAGCGGAT ATTGCCACGC GTCAGATGCT GAACAAGCCA 
CCGTTGCCGT TCACCAAAGG TTTGCGTCTG GGCAACATGC CGCAGATCCG CGTGATTGTG 
GATGAAGAGC TGGAGAGCGT GTGGACCGGT AAGAAGACAC CACAGCAGGC GCTGGATACT 
GCCGTTGAGC GTGGGAACCA GTTACTGCGC CGCTTTGAGA AATCGACGAA GTCTTAA

Protein sequence

MKPLRYTASA LALGLALMAN AQAATTIPFW HSMEGELGKE VDSLAQRFNA ENPDYKIVPT 
YKGNYEQNLS AGIAAFRTGN APAILQVYEV GTATMMASKA IKPVYDVFKE AGIQFDESQF 
VPTVSGYYSD SKTGHLLSQP FNSSTPVLYY NKDAFKKAGL DPEQPPKTWQ DLADYAAKLK 
ASGMKCGYAS GWQGWIQLEN FSAWNGLPFA SKNNGFDGTD AVLEFNKPEQ VKHIAMLEEM 
NKKGDFSYVG RKDESTEKFY NGDCAMTTAS SGSLANIREY AKFNYGVGMM PYDADAKDAP 
QNAIIGGASL WVMQGKDKET YTGVAKFLDF LAKPENAAEW HQKTGYLPIT KAAYDLTREQ 
GFYEKNPGAD IATRQMLNKP PLPFTKGLRL GNMPQIRVIV DEELESVWTG KKTPQQALDT 
AVERGNQLLR RFEKSTKS