Gene BURPS1106A_A3039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A3039
Symbol
ID	4904233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2953793
End bp	2954794
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	74%
IMG OID	640146142
Product	glycosyl transferase, group 2 family protein
Protein accession	YP_001077068
Protein GI	126456428
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.200076
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCAC CGCACTGGAG GCCGCCGCCC GTCGTGTCGA TCGTCGTGCC GACGTACCGG 
CGGCCGGAGC TGCTCGAACG CTGCCTCGGC GCGCTCGCGT CGCAGGTGTT CGATCCGGGC 
ACCTACGAGA TCGTCGTCGT CGACGACGAT GCGGCCGGCA GCGCGCGCCC CGTCGTCGAT 
GCGCTGACCG TGCGCATGGG CGGGCTGCCC GCGATCCGTT ACGTGAGCGC GCCGCGCACG 
CAGGGCCCGG CCGGCGCGCG CAACGCGGGC TGGCGCGAAG CGGCGGGCCC GGTGATCGCG 
TTCACCGACG ACGACACGAT CGCCGATCCG CTATGGCTGC GCAACGGCTG CTCGGCGCTG 
CTCGCGCAGC CCAACGCGTC GGCCGCGGCC GGGCGCATCG AGGTGCCGCT CGCGCCGTGC 
CCGACCGATT ACGAGCGCGA CGCGGGCGGG CTCGCCCACG CGGAGTTCGC GACCGCGAAC 
TGTTTCGTGC GGCGCGCGGC GCTCGAGCGC GTCGGCGGCT TCGACGAGCG CTTCACGCGC 
GCGTGGCGCG AGGACGCGGA CCTGATGTTC GCACTGCGCG AGCGCGCGGG GCCGATCGTC 
GACGCGCGCA CGGCGACGAT CGTGCATCCG GTGCGGCCCG CGCGCTGGGG CGTGAGCATC 
GCGCAGCAGT CGAAAGTGTT TTTCGACGCG CTGCTGTACA AGAAGCATCG CGACGTCTAC 
CGTCGGCACA TCCGCTCCGT GCCGCCGTGG CATTACTACG CGGCGGTGCT CGCGCTGCTC 
GGCGCGTGCG TCGCGCTCGC GCTCGGCCTG CATGCGGCCG CGGCCGCGTG CGCGGCGGCC 
TGGGCCGGCA TCACGGCGGC GTTCTGCTGG CGGCGCCTGC GCGGCACCGC GCACACGCCG 
TCGCACGTCG CGGAGATGAT CGTCACGTCG ATCGCGATTC CGCCCGTGTC GCTGTACTGG 
CGGCTGCGCG GCGCGCTCCA CTTCCGGGTG CTGTTCCTAT GA

Protein sequence

MNAPHWRPPP VVSIVVPTYR RPELLERCLG ALASQVFDPG TYEIVVVDDD AAGSARPVVD 
ALTVRMGGLP AIRYVSAPRT QGPAGARNAG WREAAGPVIA FTDDDTIADP LWLRNGCSAL 
LAQPNASAAA GRIEVPLAPC PTDYERDAGG LAHAEFATAN CFVRRAALER VGGFDERFTR 
AWREDADLMF ALRERAGPIV DARTATIVHP VRPARWGVSI AQQSKVFFDA LLYKKHRDVY 
RRHIRSVPPW HYYAAVLALL GACVALALGL HAAAAACAAA WAGITAAFCW RRLRGTAHTP 
SHVAEMIVTS IAIPPVSLYW RLRGALHFRV LFL