Gene BURPS1106A_A3028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A3028
Symbol
ID	4904574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2942002
End bp	2943498
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	73%
IMG OID	640146131
Product	glycosyl transferase, group 1 family protein
Protein accession	YP_001077057
Protein GI	126457864
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.220926
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTGTTGCC GCGCGCGGCG CGCGCGGCGC CGTGCTTTTC GGCAAGCCGT TGTAACTTTT 
GCGGCCGCGT TCGCACATCC TCGCGCGCGC GGCAAACGGG CATGCGCGTT GCGCACGCCT 
GCCGCAAAGG GCACATTCGC GCCCGCCGGC ACGGGAGCCA TCGTCATGCA GAAAATCGCG 
TTGATCAGTG AGCACGCATC GCCGCTCGGC GTCATCGGAG GCGTCGACGC GGGCGGCCAG 
AACATCTATG TCGCGAACGT CGCCAAGCAG CTCGCGCGGC TCGGCGTCGA CGTCGACGTG 
TTCACGCGCT GCGACAATCC GCACCTGCCC GACGTCGCGC ACATCGGCGC GGGCATCCGC 
GTGATCCACG TACCGGCCGG CCCGCCGTCG AACGTACCGA AGGAAGCGCT GCTGCCGTAC 
ATGAAGGCAT TCTCGGCATT CCTCATCGAC TGGTTCCGGC GCGAGCCGAC GCCTTACGAC 
GCGATGCACG CGAACTTCTT CATGTCCGGC GACGCGGCGC TGCGCGTGAA GGCGCGCCTC 
GGCGTGCCGC TCGTGATGAC GTTCCATGCG CTCGGCCGCG TGCGCCGCCG GCATCAGGGC 
GCGGCCGACG GCTTTCCGGA CGCGCGCTTT CCGATCGAGG ACGCGCTCGC GAAGCGCGCC 
GATCGCGTGA TCGCCGAGTG CCCGCAGGAC GCGGCCGATC TGCGCGCGCT GTACCGCGCC 
GATCCGGGCC GCATCGAGAT CGTGCCGTGC GGCTTCGACG AAGAAGAGTT TCGCCCGGTG 
CTGCGGCGCG CCGCGCGCGC GCGGCTCGGC TGGCGCGACG ACGAATTCGC GGTGCTGCAG 
CTCGGGCGCC TCGTGCCGCG CAAGGGCATC GACAACGTGA TCGAGGCGCT CGCGCGCGTG 
CCGCGCGACG CGGGCGCGCG GCCGGCCCGT CTCTATGTGG TGGGCGGCAG CGACTACGAG 
CCGGACCCGT CGCGCTGCGC GGAGCTCGCG CGCCTCGCCG GCATCGCGCG CGAAGCCGGC 
GTGGCCGATC GCGTGACGTT CGTCGGCCGG CGCGATCGCG ACGCGCTGCA CCTCTACTAC 
GGCGCGGCCG ACGTGTTCGT GACGACGCCG TGGTACGAGC CGTTCGGGAT CACGCCCGTC 
GAGGCGATGG CGTGCGCGAC GCCCGTGATC GGCAGCGACG TCGGCGGCAT CCGCACGACA 
GTCGAGCACG GCGTGACGGG CTATCTCGTC GCGCCGCGCG ATCCGGGCGC GCTCGCCGCG 
CGGCTCGACG AACTGCGGCG CGACCCCGAG CGCGCGCAGC AGTTGGGCTG GGCCGGCTAC 
CGGCGCGCGC ATCGCCATTA CACGTGGCGC GGCGTGGCCG AGCGGCTCGC GGCGATCTAT 
CGCGACGTCG CCGCGTGCGC GCGGCGCGGC GCGCGCGCGG GCACGGCGGC GCACGTGCGG 
CGCTCGCCCG TCGCGCCCTC GGCAACGGTT GCGAACCAGA AGGAGAACGG ATCATGA

Protein sequence

MCCRARRARR RAFRQAVVTF AAAFAHPRAR GKRACALRTP AAKGTFAPAG TGAIVMQKIA 
LISEHASPLG VIGGVDAGGQ NIYVANVAKQ LARLGVDVDV FTRCDNPHLP DVAHIGAGIR 
VIHVPAGPPS NVPKEALLPY MKAFSAFLID WFRREPTPYD AMHANFFMSG DAALRVKARL 
GVPLVMTFHA LGRVRRRHQG AADGFPDARF PIEDALAKRA DRVIAECPQD AADLRALYRA 
DPGRIEIVPC GFDEEEFRPV LRRAARARLG WRDDEFAVLQ LGRLVPRKGI DNVIEALARV 
PRDAGARPAR LYVVGGSDYE PDPSRCAELA RLAGIAREAG VADRVTFVGR RDRDALHLYY 
GAADVFVTTP WYEPFGITPV EAMACATPVI GSDVGGIRTT VEHGVTGYLV APRDPGALAA 
RLDELRRDPE RAQQLGWAGY RRAHRHYTWR GVAERLAAIY RDVAACARRG ARAGTAAHVR 
RSPVAPSATV ANQKENGS