Gene BURPS1106A_2519 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2519
Symbol
ID	4900418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2477195
End bp	2478562
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	75%
IMG OID	640135746
Product	uracil-DNA glycosylase
Protein accession	YP_001066778
Protein GI	126454213
COG category	[L] Replication, recombination and repair
COG ID	[COG1573] Uracil-DNA glycosylase
TIGRFAM ID	[TIGR00758] uracil-DNA glycosylase, family 4

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.31218
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATGGA CTGAAGCGGC GCTCGAAGAA CTGGGGCTCG CGCCCGCGTG GGTGCGGCGC 
GACGCGGCGC GCGCTGTGGA CGTGAACGAG GCGGCCGCGC ACGCGGCCGG AGAAGCCGCG 
GTCGCGGCGG TTGGGCGAGG AGCGCAGCCG GCGTCGCCGG ATGCGCCGCG CGAGCCGGCG 
CGTCGGATCG CGCGCGATGG TGGGCGCGAC GGCGGGCAAG ACGGCGCGAG TGGCGACGCG 
GGATCGGCGT CGCCGAACGA CGCGGCGCAT GCGATGGCGC GTGTCGCGGG CGCGGAAGCG 
AGCGCAGCCG CCGCCGTCGC CGACGAACGC GCGGCGCTTG CGCGGCAGGC CGGCGACGGG 
CGCGGACAGG CGCGGCAAGC GGCGGCCGAA TCCGGCGTGC GGGCGGCGGC GGATGCGCCC 
GCGCCGGCCG CGGCGCCCGA ATCGCGAACG CGGGATGCGA CGATTGCGCG CGGGGCTTCG 
CCGGCTGAGC CGGACGAGCC GGGCGTGGCA GGCGTGGTGG GCGTGGCGGA CGAGCCGAGC 
GTGGCGGGCG GCGCACGCCG CGCGCGGACG AGTGGCGGCG GCGCGGAGGT GCCGGCGAGC 
GCGCTTGACT TGACGGATGC GGCCGAGGCA ACGCGTCCGG CGGCGGCGCC CGCGCCGGCC 
GCGCTCACCG GTGGCGATGC CGGCGCGGCG GCGTCCGACG AGGACATGTC GTGGTTCGAT 
CTCGAACCGG TGCACGAGCC CGCGCTGCCG GACGTTGCCG CACGGCCCGC CGCCACTACG 
CCGTCCGTCG CCGAGCTCGG CTGGGACGAA CTGCGCGCGC GCGTCGCCGA CTGCGCGCGC 
TGCCGCCTCT GCGAAAAGCG CACGAACACG GTGTTCGGTG TCGGTGACGA GCACGCCGAC 
TGGATGCTCG TCGGCGAGGC GCCCGGCGAG AACGAGGACA AGCAAGGCGA GCCGTTCGTC 
GGCCAGGCGG GCAAGCTGCT CGACAACATG CTGCGCGCGC TGGCGCTCAA GCGCGGCGAG 
AATGTCTACA TCGCGAACGT GATCAAGTGC CGGCCGCCCG GCAACCGCAA TCCGGAGCCC 
GACGAGGTCG CGCGCTGCGA GCCGTATCTG CAGCGGCAGG TCGCGCTCGT GAAGCCGAAG 
CTGATCGTCG CGCTCGGCCG CTTCGCCGCG CAGACGCTGC TCAAGACGGA CGGAAGCATC 
GCTTCGATGC GCGGGCGCGT GCATCAGTAC GAAGGCGTGC CCGTGATCGT CACGTACCAT 
CCGGCGTATC TGCTGCGCAG CCTGCAGGAC AAGGCGAAGG CCTGGTCCGA TCTGTGTTTG 
GCGAACGATA CCTACCGGAG TGCCGCGCCC GCCGCCGATC CGCCATGA

Protein sequence

MAWTEAALEE LGLAPAWVRR DAARAVDVNE AAAHAAGEAA VAAVGRGAQP ASPDAPREPA 
RRIARDGGRD GGQDGASGDA GSASPNDAAH AMARVAGAEA SAAAAVADER AALARQAGDG 
RGQARQAAAE SGVRAAADAP APAAAPESRT RDATIARGAS PAEPDEPGVA GVVGVADEPS 
VAGGARRART SGGGAEVPAS ALDLTDAAEA TRPAAAPAPA ALTGGDAGAA ASDEDMSWFD 
LEPVHEPALP DVAARPAATT PSVAELGWDE LRARVADCAR CRLCEKRTNT VFGVGDEHAD 
WMLVGEAPGE NEDKQGEPFV GQAGKLLDNM LRALALKRGE NVYIANVIKC RPPGNRNPEP 
DEVARCEPYL QRQVALVKPK LIVALGRFAA QTLLKTDGSI ASMRGRVHQY EGVPVIVTYH 
PAYLLRSLQD KAKAWSDLCL ANDTYRSAAP AADPP