Gene BURPS1106A_A2926 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2926
Symbol
ID	4905471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2857232
End bp	2858422
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	73%
IMG OID	640146029
Product	glycosyl transferase, group 2 family protein
Protein accession	YP_001076955
Protein GI	126456417
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID	[TIGR03469] hopene-associated glycosyltransferase HpnB

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.896752
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCTCA TCGTCGTGTT TCTGCTGTCT TGCCTGTCGC TCGTGATCTG GCTCGTGCTG 
CTGTTCGGGC GCGGCGGCTT CTGGCGCGCG CGTGCCGCGC GGCGGCTGCC GCCCGACGCG 
CGCGGCGCGG CCGCGGCCGC CGGCTGGCCG GCCGTCGCGA CCGTCGTGCC CGCCCGCAAC 
GAGGCGGACG TGATCGGCGA GGCGGTTCGC TCGCTCGTCG AGCAAGCGTA CGAAGGCGCG 
TTTCACCTGA TCGTCGTCGA CGACCACAGC ACCGACGGCA CCGCCGAGGC CGCGCGCGCG 
GCCGCGGCGG CCGTCGGCTG CGCCGACCGG CTGACCGTGC TCGCCGCGCA GCCGCTGCCC 
GCCGGCTGGT CGGGCAAGGT GTGGGCGCAG TCGCAGGGGA TCGCCGCGGT GCGCTCGCTC 
GGGCTGCCCG CCGACTACCT GCTGCTGACG GACGCCGACA TCGGTCATCC GCCGGACGCG 
GTCGCGCAGC TCGTCACGCG CGCGCAGGCG GAGCAGCGCG ATCTCGTATC GCTGATGGTG 
CGGCTGCGCT GCGATTCGTT CTGGGAAAAG GCGCTGATTC CGGCGTTCGT GTTCTTCTTC 
GCGAAGCTCT ACCCGTTCTC GTGGATCAAC GATCCGCGCA ACCGGACGGC GGGCGCGGCG 
GGCGGCTGCA TGCTCGTGCG CCGCGACGCG CTCGAGGAGG CGGGCGGCAT CGAATCGATC 
CGCGGCGCGC TGATCGACGA TTGCAGCCTG GCCGCGCAGA TCAAGCACCG CGGCGCCGGC 
CGCCACCCGA TCCGGCTCGA TCTCGCCGAT CGCAGCGTGT CGTTGCGGCC GTACGACAGC 
TGGCGCGACA TCTGGAACAT GATCGCGCGC ACCGCGTTCA CGCAGTTGCG GTATTCGCCG 
GTGCTGCTGC TCGGCACGCT CGTCGGGATG ACGATCCTCT ACCTGGTGCC GCCCGTCGCC 
GCGCTCGCGT ACGGCGCGCG CGCGTGGCCG GCATGGCTCG CGTGGGCGTC GATGTGCACT 
GCCTATGCGC CGATGCTCAG CTACTACCGC CGCTCGCCGT GGTGGGCGCC GGCGCTGCCG 
CTCGTCGCGC TGTTCTATGT CGGCGCGACG TTCGCGTCGG CCGTGCGCTA CTGGCGCGGC 
AAGGGCGGAC AGTGGAAGGC GCGCGTGCAG GCGCCGGTGC GGGATCGTTG A

Protein sequence

MTLIVVFLLS CLSLVIWLVL LFGRGGFWRA RAARRLPPDA RGAAAAAGWP AVATVVPARN 
EADVIGEAVR SLVEQAYEGA FHLIVVDDHS TDGTAEAARA AAAAVGCADR LTVLAAQPLP 
AGWSGKVWAQ SQGIAAVRSL GLPADYLLLT DADIGHPPDA VAQLVTRAQA EQRDLVSLMV 
RLRCDSFWEK ALIPAFVFFF AKLYPFSWIN DPRNRTAGAA GGCMLVRRDA LEEAGGIESI 
RGALIDDCSL AAQIKHRGAG RHPIRLDLAD RSVSLRPYDS WRDIWNMIAR TAFTQLRYSP 
VLLLGTLVGM TILYLVPPVA ALAYGARAWP AWLAWASMCT AYAPMLSYYR RSPWWAPALP 
LVALFYVGAT FASAVRYWRG KGGQWKARVQ APVRDR