Gene BURPS1106A_A2949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2949
Symbol
ID	4904079
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2874909
End bp	2875970
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	67%
IMG OID	640146052
Product	glycosyl transferase, group 2 family protein
Protein accession	YP_001076978
Protein GI	126457757
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGGATC AAATAGACAT ACCGCTCATT TCGCTCGTCG TGCCGTTCTA CAACGAAGGC 
GACGCGGTCA CGCGGTTCTT TGCGGAAGTG ATGCCGCTGA TGGAGGCGAT CGAATCGATC 
CGCTTCGAGA TCGTCTGCGT GAACGACGGC AGCCGCGACG ACACGCTCGA GCAACTCGTC 
GCGGTCGGCG CGCGCGAGCC GCGCGTGCGC GTGATCGATC TGACGCGCAA CTTCGGCAAG 
GAAGCCGCGC TGACGGCGGG CCTCGACGAA GCGAACGGCG ACGCGGTGAT CCCGATCGAC 
GCGGACCTGC AGGATCCGCC GAGCCTGATT CCCGTGATGA TCGACCATTG GCGCGACGGC 
GCCGAGGTCG TGGCGGCGAA GCGCAGCAAC CGCGCGTGCG ACACGTTCGC GAAGCGCACC 
GCCGCCGCGC TGTATTACCG CGTGCACAAT GCGCTGTCCG AAGTGAAGCT GCCGGTCAAC 
GTCGGCGATT TCCGGCTGAT GGACCGGCAG GTCGTCAACG CGTTGCGCAG CCTGCCGGAG 
CGCCGGCGCT TCATGAAGGG GCTGTTCGCG TGGGTGGGCT ACCGGACCGT GATCGTCGAG 
TATCAGCGCG AGGCGCGCTG CGCGGGCCAC TCGAAATTCT CCGGCTGGAA GCTCTGGAAC 
TTCGCGCTCG AAGGGATCAC GAGCTTCAGC ACGGTGCCGC TGCGCAGCTG GACCTACATC 
GGGCTCGGCA TCGCGGCGCT CGCGTTCCTC TACGGCGGGT TCATCGTCGC GCGCACGCTG 
TGGCTGGGCA ATCCGGTGCC GGGTTACGCG TCGCTGATTT CGGTGATGCT GTTCATCGGC 
GGAATCGAGC TGGTCGGCAT CGGCGTCGTC GGCGAGTACA TCGGCCGCAT CTATTACGAA 
TCGAAGGAGC GGCCGATCTA TCTCGTGCGC CGCCGCTATC AGGCGCGCAC GAAGGTGAGC 
GCGCTGCCCG TGGGAGCCGC CGCGACGCGC GTCGCGCATG GCGCGCGGGC GGAGTTCGCC 
CGGCGCCGCG CGATGCCGCG CGCGCGTGCC GACAGCCGTT GA

Protein sequence

MRDQIDIPLI SLVVPFYNEG DAVTRFFAEV MPLMEAIESI RFEIVCVNDG SRDDTLEQLV 
AVGAREPRVR VIDLTRNFGK EAALTAGLDE ANGDAVIPID ADLQDPPSLI PVMIDHWRDG 
AEVVAAKRSN RACDTFAKRT AAALYYRVHN ALSEVKLPVN VGDFRLMDRQ VVNALRSLPE 
RRRFMKGLFA WVGYRTVIVE YQREARCAGH SKFSGWKLWN FALEGITSFS TVPLRSWTYI 
GLGIAALAFL YGGFIVARTL WLGNPVPGYA SLISVMLFIG GIELVGIGVV GEYIGRIYYE 
SKERPIYLVR RRYQARTKVS ALPVGAAATR VAHGARAEFA RRRAMPRARA DSR