Gene BURPS1106A_1274 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1274
Symbol
ID	4900608
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	1248603
End bp	1249637
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	69%
IMG OID	640134504
Product	glycosyl transferase, group 1 family protein
Protein accession	YP_001065553
Protein GI	126454366
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCA TGATCGTCAC CGATGCGTGG GAGCCGCAAG TCAACGGCGT CGTGCGCACG 
CTCAAGAGCA CGGCGCGCGA GCTCACCGCG CTCGGCCACC GCGTCGAGCT CGTCACGCCG 
CTCGAATTCC GCACGGTGCC CTGCCCGACC TATCCCGAAA TCCGCCTGTC GATCCTGCCG 
TACCGGCGGC TGCGCGAGCG CCTGGACGCG TTCGAGCCGC ACGCGCTGCA CATCGCGACC 
GAAGGCCCGC TCGGGCTCGC CGCGCGCCGC TACGCGCGCG CGCGCAAGCT GCCGTTCACG 
ACCGCGTACC ACACGCGCTT TCCGGAATAC GTGCAGGCGC GCTTCGGCGT GCCGCTCGCG 
GCGACCTATC GCTTCCTGCG ATGGTTCCAC GGCGCGTCGC TCGCCGTGAT GGCGCCGACG 
CCCGTCGTCA AGGACGACCT CGAGCGCTTC GGCTTCGACA ACGTCGTGCT GTGGACGCGC 
GGCGTCGATC TCGACATCTT CCGGCCGATC GAATCGAAGG TGCTCAACAC CGCGCGGCCG 
ATCTTCCTGT ATGTCGGCCG CGTCGCGATC GAGAAGAACG TCGAGGCGTT CCTGAAGCTC 
GACCTGCCCG GCTCGAAATG GGTCGCGGGC GAGGGCCCCG CGCTCGCCGA GCTCAAATCG 
CGCTATCCTG AGGCGAATTA CCTCGGCGTG CTGACGCAGG CGGAGCTCGC CAAGGTATAT 
GCGGCAGCCG ACGTGTTCGT GTTCCCGAGC CGCACCGACA CGTTCGGGCT CGTGCTGCTC 
GAAGCGCTCG CGTGCGGCAC GCCCGTCGCC GCCTATCCGG TGACGGGCCC CGTCGACGTG 
CTCGGCGACG GCGGCGCGGG CGCGATGAAC GACGATCTGC GCGAGGCGTG CCTCGAGGCG 
CTGAAGATCG ACCGGCGGCA TGCGCGCGCG TGGGCCGAGC GCTTCTCGTG GCGCGCGGCG 
TCCGAGCAGT TCGCCTCGCA CCTGAAGCCG CTACAGAAAT CCGCCTGCCC ACACACCGAA 
GGCGCAGCCG TTTGA

Protein sequence

MKIMIVTDAW EPQVNGVVRT LKSTARELTA LGHRVELVTP LEFRTVPCPT YPEIRLSILP 
YRRLRERLDA FEPHALHIAT EGPLGLAARR YARARKLPFT TAYHTRFPEY VQARFGVPLA 
ATYRFLRWFH GASLAVMAPT PVVKDDLERF GFDNVVLWTR GVDLDIFRPI ESKVLNTARP 
IFLYVGRVAI EKNVEAFLKL DLPGSKWVAG EGPALAELKS RYPEANYLGV LTQAELAKVY 
AAADVFVFPS RTDTFGLVLL EALACGTPVA AYPVTGPVDV LGDGGAGAMN DDLREACLEA 
LKIDRRHARA WAERFSWRAA SEQFASHLKP LQKSACPHTE GAAV