Gene BURPS1106A_0308 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0308
Symbol
ID	4900257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	283856
End bp	285124
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	72%
IMG OID	640133538
Product	putative glycosyltransferase
Protein accession	YP_001064591
Protein GI	126455398
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID	[TIGR03472] hopanoid biosynthesis associated glycosyl transferase protein HpnI

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCCGTCG AAGGCCGCGC GATGAAAGCG CTCGCGTGGC TCACCGGCGC GGTCCTTGCG 
CTGCTCGCGG CCGAGCTGAT CTCGTTCGGC GACATCGGCC GCTTCGTCAC GCTGCTCGCC 
GCGTTGCTCG CCGCGCTATG CGCGCTCGCG GCCGCGTTCG GCTGCGTGTA CACGCTCGTC 
GCCGCCGCGC TCACGCACCG TTTTTTCGCG CGTGCGCCAC GCGAGCCGCA CGCGTGCCCG 
CCCGTCACGA TCGTCAAGCC GTTGCACGGC GTCGAGCGGA CGCTGTTCGC GAACCTCGCG 
AGCTTTTGCG AGCAGCGCTA CGACGGGCCG ATCCAGTTCC TGTTCGGCGT GCACGATCGC 
GACGATCCCG CGCTGCGCGC CGTCGACGCG CTGCGCACCG CGTTTCCCCG CGCGCACGTG 
ACGATCGTCG CCGACGCCCG GCTGTACGGG CCGAACCGCA AGATCGCGAA CCTCGTCAAC 
ATGCTGCCCG CCGCCGCGCA TGACGTGCTG ATCTTCGCGG ACAGCGACGT GAGCGTCGGC 
CCCGACTACG TACGGCATAT CGTCGGCGAG CTCGGCGAGC CGGGCGTCGG GCTCGTGACC 
TGCGTCTATC GCGGCCGCCC GGACCCGGGC TTCTGGCCGC GCGTCGAGGC GCTCGTCACC 
AGCCATCAGT TCCTGCCGGG CGTGGTGACG GGCCTCGCGC TGAAGCTCGC GCGGCCGTGT 
TTCGGCCAGA CGATCGCGAT GCGCCGCGCC ATGCTCGACG CGATCGGCAG CCTCGCGCAG 
TTCGCCCATC ACCTCGCCGA GGATCACGCG ATCGGCGAAG CCGTGCGCGC GCGCGGCGCG 
CGCGTCGTCG TGCCGCCGTT CGCGGTCGAG CACGGCTGCG TCGAGACGCG CGTCGCGCAG 
CTCGTCGAAC ACGAATTGCG CTGGAGCCGC ACGATCCGCG CGGTCGACCC GCGCGGCCAT 
CTGGGCTCGC TGCTCACGCA TCCGCTCGCG CTCGCGCTGC TCGCCGGCGT GCTGTCGAGC 
GGCGCCGCGT GGGCGTGGCC GCTCGTGCCT GCCGCACTCG TCGCGCGCGT CGCCGCGAAA 
CGCATCGTCG ATCGCGCGAC GAAGCGGCCG GTGCGCGACC TGTGGCTGCT GCCGCTCGCG 
GATCTGATCG CCTTCGGCAT CTTCGTCGCG AGCTTCTCGT CGTCGCGCGT GATCTGGCGC 
GGCTTCAGCT TCGACGTCGA TCGCGACGGC CGCCTATGCC CCGCGCCGGA AAAACGCCCG 
AATGCCTGA

Protein sequence

MSVEGRAMKA LAWLTGAVLA LLAAELISFG DIGRFVTLLA ALLAALCALA AAFGCVYTLV 
AAALTHRFFA RAPREPHACP PVTIVKPLHG VERTLFANLA SFCEQRYDGP IQFLFGVHDR 
DDPALRAVDA LRTAFPRAHV TIVADARLYG PNRKIANLVN MLPAAAHDVL IFADSDVSVG 
PDYVRHIVGE LGEPGVGLVT CVYRGRPDPG FWPRVEALVT SHQFLPGVVT GLALKLARPC 
FGQTIAMRRA MLDAIGSLAQ FAHHLAEDHA IGEAVRARGA RVVVPPFAVE HGCVETRVAQ 
LVEHELRWSR TIRAVDPRGH LGSLLTHPLA LALLAGVLSS GAAWAWPLVP AALVARVAAK 
RIVDRATKRP VRDLWLLPLA DLIAFGIFVA SFSSSRVIWR GFSFDVDRDG RLCPAPEKRP 
NA