Gene ECH74115_4767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4767
Symbol	ugpB
ID	6969519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4411748
End bp	4413064
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	53%
IMG OID	643388463
Product	glycerol-3-phosphate transporter periplasmic binding protein
Protein accession	YP_002272891
Protein GI	209400161
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	0.552805
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCGT TACATTATAC AGCTTCAGCA CTGGCGCTCG GACTGGCGTT AATGGGGAAT 
GCACAGGCAG TGACGACCAT TCCGTTCTGG CATTCTATGG AAGGGGAACT GGGTAAAGAG 
GTGGATTCTC TGGCCCAACG TTTTAACGCC GAAAACCCGG ATTACAAAAT TGTACCGACC 
TATAAAGGCA ATTACGAACA GAATTTAAGC GCGGGGATTG CCGCATTTCG TACCGGCAAT 
GCTCCGGCTA TTTTGCAGGT TTATGAAGTT GGCACCGCCA CCATGATGGC GTCGAAAGCC 
ATTAAACCGG TTTATGACGT GTTTAAAGAG GCGGGGATTC AATTCGATGA GTCGCAGTTT 
GTGCCGACGG TTTCCGGTTA CTACTCCGAC AGCAAAACGG GCCACTTACT CTCCCAGCCA 
TTCAACAGCT CGACTCCCGT TCTCTATTAC AACAAAGACG CCTTCAAGAA AGCGGGGTTA 
GACCCGGAAC AACCGCCGAA AACCTGGCAG GATCTGGCGG ACTATGCCGC AAAACTAAAA 
GCCTCCGGCA TGAAGTGCGG CTACGCCAGC GGCTGGCAGG GCTGGATCCA ACTGGAAAAC 
TTTAGCGCCT GGAACGGTCT GCCGTTTGCC AGCAAAAACA ACGGCTTTGA CGGCACGGAT 
GCGGTGCTGG AGTTCAACAA GCCGGAGCAG GTGAAACACA TCGCCATGCT CGAAGAGATG 
AACAAGAAGG GCGATTTCAG CTACGTCGGG CGTAAGGATG AATCCACCGA GAAGTTCTAT 
AACGGTGATT GCGCTATGAC CACCGCCTCT TCCGGTTCTC TCGCTAATAT TCGCGAGTAC 
GCCAAATTCA ACTATGGCGT AGGCATGATG CCTTACGACG CCGATGCGAA AGATGCACCG 
CAAAACGCCA TTATCGGCGG GGCCAGCCTG TGGGTGATGC AGGGCAAAGA TAAAGAAACG 
TATACCGGCG TGGCGAAGTT CCTCGACTTC CTCGCGAAGC CAGAAAACGC TGCCGAGTGG 
CATCAGAAAA CCGGTTATCT GCCAATCACC AAAGCAGCGT ATGACCTGAC CCGTGAGCAG 
GGCTTTTATG AGAAAAACCC AGGGGCGGAT ACCGCGACGC GTCAGATGCT GAATAAGCCG 
CCGTTGCCGT TCACCAAAGG GCTGCGTCTG GGCAACATGC CGCAGATCCG CGTGATTGTG 
GATGAAGAGC TGGAGAGCGT GTGGACCGGT AAGAAGACAC CACAGCAGGC ACTGGATACC 
GCCGTTGAGC GTGGAAATCA GTTGCTGCGC CGCTTTGAGA AATCGACGAA GTCTTAA

Protein sequence

MKPLHYTASA LALGLALMGN AQAVTTIPFW HSMEGELGKE VDSLAQRFNA ENPDYKIVPT 
YKGNYEQNLS AGIAAFRTGN APAILQVYEV GTATMMASKA IKPVYDVFKE AGIQFDESQF 
VPTVSGYYSD SKTGHLLSQP FNSSTPVLYY NKDAFKKAGL DPEQPPKTWQ DLADYAAKLK 
ASGMKCGYAS GWQGWIQLEN FSAWNGLPFA SKNNGFDGTD AVLEFNKPEQ VKHIAMLEEM 
NKKGDFSYVG RKDESTEKFY NGDCAMTTAS SGSLANIREY AKFNYGVGMM PYDADAKDAP 
QNAIIGGASL WVMQGKDKET YTGVAKFLDF LAKPENAAEW HQKTGYLPIT KAAYDLTREQ 
GFYEKNPGAD TATRQMLNKP PLPFTKGLRL GNMPQIRVIV DEELESVWTG KKTPQQALDT 
AVERGNQLLR RFEKSTKS