Gene BURPS668_A3168 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A3168
Symbol
ID	4888268
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2995358
End bp	2996359
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	74%
IMG OID	640133104
Product	glycosyl transferase, group 2 family protein
Protein accession	YP_001064159
Protein GI	126444830
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCAC CGCACTGGAG GCCGCCGCCC GTCGTGTCGA TCGTCGTGCC GACGTACCGG 
CGGCCGGAGC TGCTCGAACG CTGCCTCGGC GCGCTCGCGT CGCAGGTGTT CGATCCGGGC 
ACCTACGAGA TCGTCGTCGT CGACGACGAT GCGGCCGGCA GCGCGCGCCC CGTCGTCGAT 
GCGCTGACCG TGCGCATGGG CGGGCTGCCC GCGATCCGTT ACGTGAGCGC GCAGCGCACG 
CAGGGCCCGG CCGGCGCGCG CAACGCGGGC TGGCGCGAAG CGGCGGGCCC GGTGATCGCG 
TTCACCGACG ACGACACGAT CGCCGATCCG CTATGGCTGC GCAACGGCTG CTCGGCGCTG 
CTCGCGCAGC CCAACGCGTC GGCCGCGGCC GGGCGCATCG AGGTGCCGCT CGCGCCGTGC 
CCGACCGATT ACGAGCGCGA CGCGGGCGGG CTCGCCCACG CGGAGTTCGC GACCGCGAAC 
TGTTTCGTGC GGCGCGCGGC GCTCGAGCGC GTCGGCGGCT TCGACGAGCG CTTCACGCGC 
GCGTGGCGCG AGGACGCGGA CCTGATGTTC GCGCTGCGCG AGCGCGCGGG GCCGATCGTC 
GACGCGCGCA CGGCGACGAT CGTGCATCCG GTGCGGCCCG CGCGCTGGGG CGTGAGCATC 
GCGCAGCAGT CGAAAGTGTT TTTCGACGCG CTGCTGTACA AGAAGCATCG CGACGTCTAC 
CGTCGGCACA TCCGCTCCGT GCCGCCGTGG CATTACTACG CGGCGGTGCT CGCGCTGCTC 
GGCGCGTGCG TCGCGCTCGC GCTCGGCCTG CACGCGGCCG CGGCCGCGTG CGCGGCGGCC 
TGGGCCGGCA TCACGGCGGC GTTCTGCTGG CGGCGCCTGC GCGGCACCGC GCACACGCCG 
TCGCACGTCG CGGAGATGAT CGTCACGTCG ATCGCGATTC CGCCCGTGTC GCTGTACTGG 
CGGCTGCGCG GCGCGCTCCA CTTCCGGGTG CTGTTCCTAT GA

Protein sequence

MNAPHWRPPP VVSIVVPTYR RPELLERCLG ALASQVFDPG TYEIVVVDDD AAGSARPVVD 
ALTVRMGGLP AIRYVSAQRT QGPAGARNAG WREAAGPVIA FTDDDTIADP LWLRNGCSAL 
LAQPNASAAA GRIEVPLAPC PTDYERDAGG LAHAEFATAN CFVRRAALER VGGFDERFTR 
AWREDADLMF ALRERAGPIV DARTATIVHP VRPARWGVSI AQQSKVFFDA LLYKKHRDVY 
RRHIRSVPPW HYYAAVLALL GACVALALGL HAAAAACAAA WAGITAAFCW RRLRGTAHTP 
SHVAEMIVTS IAIPPVSLYW RLRGALHFRV LFL