Gene BURPS1106A_3131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3131
Symbol
ID	4903147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3051434
End bp	3053275
Gene Length	1842 bp
Protein Length	613 aa
Translation table	11
GC content	61%
IMG OID	640136357
Product	glycosyl transferase, group 2 family protein
Protein accession	YP_001067369
Protein GI	126454769
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis [COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGTTTG ATATATCCGT CGTGGTGTAT CGAGAGACGG AGGAAACCCT CGACGATCTT 
CTCGACAGCC TCGCCGCTCA AGCATCATGC CCGGATACGG TGGTTCGTGT CTGGTTGCGC 
AACAACGATC CCGCCGATGC CGATCGGTGG GATCGGTTCG TGCACGATCG GTCATGGTAT 
CCATTCGAAA TTTCGATCTC GCATTCTCCG CAGAACGTGG GCTTCGGGCG CGCGCACAAT 
GCGACGTTCG AAATGGCCGA CGCTCCGTTT TTCTTTGTCT TGAATCCGGA TACGCGACTG 
CATTCGACTG CCGTCTCGGC ATTGCGGAAG GCGATAGACA CGTCTGCCGG CGACGTGGGC 
GCCTGGGAGT TGCGGCAACT GCCGTACGAG CATCCGAAAC TGTACGATCC CGTTTCGCTG 
AGCACGGACT GGGTGACAGG TGCCGCCGTC GTGTTCCGGC GTGCCGCGTT TGCGCAGGTG 
CGCGGTTTCG AGCCGCGTAT CTTCATGTAT GGGGAAGATG TCGACCTATC GTGGCGAATG 
CGCGCCGCGG GCTGGGTATT GCATTATGTG CCGCATGCTG TCGTCGTACA CCCCACGTAT 
TCGAAACCGA TGGAGGCCAA ACCGCTCCAG ATCGCAGGCG GCGTGGTCGC ATCGTTGCAA 
TTGCGTACGA GGTTCGGGTC CTGGCTCGAT ATCGCTCGCG GTCTAGGTTG CTGGGTTGCC 
GAACTCGCGA GGCCGGCGCG CTTCCCGCAT GCGCGGCGCA CGCATCTGAT GGCACTGGCT 
CGATATCTTC GGAGCGCAGC CTACTTCAGG CGCACGGGGG CACGGTATCG CAAAGGCGGT 
TTTCGCCCCG GTTTTCGTTT TTGGGGATAT GGTGACCGAC GCGACGGCGC ATTTTTTGCC 
TTCGCGGTCG AGGAACTCGA CGCGCGCACG GTGCCGCTTG TCTCGATCAT CGTGCGAACG 
CATCGCCGGC CGGCATTGTT GCGGGAGGCG CTGATGTCAC TGTCGCATCA AACCTATCCG 
CGTGTCGAAG TCATTGTCGT CGAGGACGGC GAGCCGAATA GCCGCGCGAT GATCGAGCGC 
GAATTTGCAG GGCGCCTTGA TATCCGCTAT GAGGCGACGG GCATGCCGGT AGGCAGGAGT 
GCCGCCGGGA ATCTGGGGCT TTCGCTCGCC GCCGGGGAAT GGCTGGGATT TCTTGACGAC 
GACGACCAGT TCTACGCAGA CCACGTCGAG GCAATGATGC AGGTCGCGCG AAGCGGTACG 
AACCGGGCAG TCTATGGTGC GTCGCACGAG ATTCCGACCG AATTTGCACA ATTGACGGAA 
GAGGCCGCGA CATATCGCGA AGAGCCCGCG TCGCTCAAGT ATCGACCATA TTCCCGCCTG 
GCGATGTGGC AGGAGAACCT TGCGCCGATT CAAGCAGTCC TCTTCCATCG AAGCTTGTAT 
GACGAATTGG GCGGATTTGA CGAGGACCTC GATCAACTCG AAGACTGGGT GCTGTGGGTG 
CGCTATTCGT GTGCGACTGA CTTCTCTTCG TTCCTGCGGG TGACATCACG CTACCGGGTG 
CCCATGGCGG CCAAGGTTGC CGTTGAGCGT CAGGCCAAGC TGCATGAGGC CTATGCCGTC 
GCCCTGGAGC GACAGCGAGC GATGCGAGTG ACGCTTAGCC CGTTCGACGT TGTCGCCATG 
GCGGAAGAGC AGGCCCGTCG GCATGCTATC GTCCACGTTT CGAGGCAAAC CGCGCGAAAG 
CTGATCGTGC GAGTGCCGTT CATGCGAACG TTGTTATCGA GCCAGGCGGG ATGGCGACGG 
CGCATGAGAG CGCTATATCG TCGAATGTCG CCGCGCTCCT GA

Protein sequence

MRFDISVVVY RETEETLDDL LDSLAAQASC PDTVVRVWLR NNDPADADRW DRFVHDRSWY 
PFEISISHSP QNVGFGRAHN ATFEMADAPF FFVLNPDTRL HSTAVSALRK AIDTSAGDVG 
AWELRQLPYE HPKLYDPVSL STDWVTGAAV VFRRAAFAQV RGFEPRIFMY GEDVDLSWRM 
RAAGWVLHYV PHAVVVHPTY SKPMEAKPLQ IAGGVVASLQ LRTRFGSWLD IARGLGCWVA 
ELARPARFPH ARRTHLMALA RYLRSAAYFR RTGARYRKGG FRPGFRFWGY GDRRDGAFFA 
FAVEELDART VPLVSIIVRT HRRPALLREA LMSLSHQTYP RVEVIVVEDG EPNSRAMIER 
EFAGRLDIRY EATGMPVGRS AAGNLGLSLA AGEWLGFLDD DDQFYADHVE AMMQVARSGT 
NRAVYGASHE IPTEFAQLTE EAATYREEPA SLKYRPYSRL AMWQENLAPI QAVLFHRSLY 
DELGGFDEDL DQLEDWVLWV RYSCATDFSS FLRVTSRYRV PMAAKVAVER QAKLHEAYAV 
ALERQRAMRV TLSPFDVVAM AEEQARRHAI VHVSRQTARK LIVRVPFMRT LLSSQAGWRR 
RMRALYRRMS PRS