Gene B21_03255 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03255
Symbol	ugpB
ID	8113299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3452592
End bp	3453908
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	53%
IMG OID	644849432
Product	hypothetical protein
Protein accession	YP_003001005
Protein GI	251786701
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACCGT TACATTATAC AGCTTCAGCA CTGGCGCTCG GACTGGCGTT AATGGGGAAT 
GCACAGGCAG TGACGACCAT TCCGTTCTGG CATTCTATGG AAGGGGAACT GGGTAAAGAG 
GTGGATTCTC TGGCCCAACG TTTTAACGCC GAAAATCCGG ATTACAAAAT TGTACCGACC 
TATAAAGGCA ACTACGAACA GAATTTAAGC GCGGGGATTG CCGCATTTCG TACCGGCAAC 
GCTCCGGCTA TTTTGCAGGT TTATGAAGTT GGCACCGCCA CCATGATGGC ATCGAAAGCC 
ATTAAACCGG TATATGACGT GTTTAAAGAG GCGGGGATTC AATTCGATGA GTCGCAGTTT 
GTGCCGACGG TTTCCGGTTA CTACTCCGAC AGCAAAACGG GCCACTTACT CTCCCAGCCA 
TTCAACAGCT CGACCCCCGT TCTCTATTAC AACAAAGACG CCTTCAAGAA AGCAGGATTA 
GACCCGGAAC AACCGCCGAA AACCTGGCAG GATCTGGCGG ACTATGCCGC GAAACTGAAA 
GCCTCCGGTA TGAAGTGCGG CTACGCCAGC GGCTGGCAGG GCTGGATCCA ACTGGAAAAC 
TTTAGCGCCT GGAACGGTCT GCCGTTTGCC AGCAAAAACA ACGGCTTTGA CGGCACGGAC 
GCGGTGCTGG AGTTCAACAA GCCGGAGCAG GTGAAACACA TCGCCATGCT CGAGGAGATG 
AACAAGAAGG GCGACTTCAG CTACGTCGGT CGTAAGGATG AATCCACCGA GAAGTTCTAT 
AACGGTGATT GCGCGATGAC CACCGCCTCT TCCGGTTCTC TTGCCAACAT TCGCGAGTAC 
GCCAAATTTA ACTACGGCGT AGGCATGATG CCTTACGACG CCGATGCGAA AGATGCGCCA 
CAAAACGCCA TTATCGGCGG AGCCAGCCTG TGGGTGATGC AGGGTAAAGA TAAAGAAACG 
TATACCGGTG TGGCGAAGTT CCTCGATTTC CTCGCGAAGC CAGAAAACGC TGCCGAGTGG 
CATCAGAAAA CCGGTTATCT GCCAATCACC AAAGCAGCGT ATGACCTGAC CCGTGAGCAG 
GGCTTTTATG AGAAAAACCC AGGGGCGGAT ACCGCGACGC GTCAGATGCT GAATAAGCCG 
CCGTTGCCGT TCACCAAAGG GCTGCGTCTG GGCAACATGC CGCAGATCCG CGTGATTGTG 
GATGAAGAGC TGGAGAGCGT GTGGACCGGT AAGAAGACAC CACAGCAGGC ACTGGATACC 
GCCGTTGAGC GTGGAAATCA GTTGCTGCGC CGCTTTGAGA AATCGACGAA GTCTTAA

Protein sequence

MKPLHYTASA LALGLALMGN AQAVTTIPFW HSMEGELGKE VDSLAQRFNA ENPDYKIVPT 
YKGNYEQNLS AGIAAFRTGN APAILQVYEV GTATMMASKA IKPVYDVFKE AGIQFDESQF 
VPTVSGYYSD SKTGHLLSQP FNSSTPVLYY NKDAFKKAGL DPEQPPKTWQ DLADYAAKLK 
ASGMKCGYAS GWQGWIQLEN FSAWNGLPFA SKNNGFDGTD AVLEFNKPEQ VKHIAMLEEM 
NKKGDFSYVG RKDESTEKFY NGDCAMTTAS SGSLANIREY AKFNYGVGMM PYDADAKDAP 
QNAIIGGASL WVMQGKDKET YTGVAKFLDF LAKPENAAEW HQKTGYLPIT KAAYDLTREQ 
GFYEKNPGAD TATRQMLNKP PLPFTKGLRL GNMPQIRVIV DEELESVWTG KKTPQQALDT 
AVERGNQLLR RFEKSTKS