Gene BURPS1106A_0647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0647
Symbol
ID	4899585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	619517
End bp	620758
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	67%
IMG OID	640133877
Product	glycosyl transferase, group 1 family protein
Protein accession	YP_001064929
Protein GI	126454998
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0914561
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAGGTAG CAATCGTTCA CGACTGGCTG GTGGTGTATG GCGGCGCGGA GCGTGTGCTC 
GCGCAGATGA TCGACTGCTT TGCGCAAGCC GACATCTACA GCCTCGTCGA TTTTCTCGAC 
GACCGCTCGT GCCTGCGTGG CCGGCCGGTG CACACCTCGT TCATCCAGAA ATTGCCGTTC 
GCGCGCAGCA AGTACCGCAG CTATTTGCCG CTCTTTCCGC TCGCGATCGA GCAGTTCGAT 
CTGTCCGGCT ACGACCTGAT CCTGTCGAGC TCGTATGCGG TCGCCAAGGG CGTGCTGAAC 
GGCCCGGACC AGTTGCATGC GAGTTACGTG CACTCGCCCG TGCGCTACGC GTGGGACCTG 
CAGCATCAGT ACCTGAACGA AGCGGGGCTC GCGCGCGGCG TGAAATCGGC GCTCGCGCGC 
ACGTTGCTGC ACTACATCCG CAACTGGGAT GCGCGCTCGG CGAACGGGGT CGACCTGCTC 
GCGGCGAATT CGCGCTTCGT CGCGCGACGT ATCCGCAAGA CGTATCGGCG CGACGCGACG 
GTCATCTATC CGCCCGTCGA CGTCGATCAT CTCGCGCTGC GCGACACGAA GGACGACTTC 
TATCTGACGG CGTCGCGCCT CGTGCCGTAC AAGCGGATCG ATCTGATCGT CGAGGCGTTT 
TCGCACATGC CGTCGCGCCG GCTCGTCGTG ATCGGCGACG GGCCGGAGGC GGCGAAGATC 
CGCGCGCTCG CGGGCCCGAA CGTCACGCTG CTCGGCTACC AGCCGTTCGA CGTGCTGCAC 
GATCATCTGC AGCGCGCGAA GGCGTTCGTG TTCGCCGCGG AAGAGGATTT CGGCATCTCG 
CCCGTCGAAG CGCAGGCATG CGGCACGCCC GTGATCGCAT ACGGCAAGGG CGGCGTGTGC 
GAATCGGTGC GCGCGGCGGG CGCGGCGCCG ACGGGCCTCT TCTATGCGAA GCAAACGTGC 
GACGCGCTGA TCGATGCGAT CGACCGGTTC GAGGCGATGC CGGCGGGCAC ATTCGATCCG 
CACGCGTGCC GCGCGAACGC GGAGCGCTTC AGCGCCGCGC GCTTTCGCTC GACGTTCTCG 
CGCTTCGTGC TCGAGGGCTA CGCCGCGTTG CAGGCGGAAA TGGGCGAGAC GATGCAGGAC 
GCGCCGCTCG AGCCGGGTGG CGCGCCGGAC GGCGCGCCTG TCGAGCGCGA CGCGGCGGCG 
CCGCACGGCG CCTGCCGGAA CGAAACGCTC GCGCGCATCT GA

Protein sequence

MKVAIVHDWL VVYGGAERVL AQMIDCFAQA DIYSLVDFLD DRSCLRGRPV HTSFIQKLPF 
ARSKYRSYLP LFPLAIEQFD LSGYDLILSS SYAVAKGVLN GPDQLHASYV HSPVRYAWDL 
QHQYLNEAGL ARGVKSALAR TLLHYIRNWD ARSANGVDLL AANSRFVARR IRKTYRRDAT 
VIYPPVDVDH LALRDTKDDF YLTASRLVPY KRIDLIVEAF SHMPSRRLVV IGDGPEAAKI 
RALAGPNVTL LGYQPFDVLH DHLQRAKAFV FAAEEDFGIS PVEAQACGTP VIAYGKGGVC 
ESVRAAGAAP TGLFYAKQTC DALIDAIDRF EAMPAGTFDP HACRANAERF SAARFRSTFS 
RFVLEGYAAL QAEMGETMQD APLEPGGAPD GAPVERDAAA PHGACRNETL ARI