Gene BURPS668_2463 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2463
Symbol
ID	4885035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	2432214
End bp	2433581
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	74%
IMG OID	640128391
Product	uracil-DNA glycosylase
Protein accession	YP_001059495
Protein GI	126438636
COG category	[L] Replication, recombination and repair
COG ID	[COG1573] Uracil-DNA glycosylase
TIGRFAM ID	[TIGR00758] uracil-DNA glycosylase, family 4

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATGGA CTGAAGCGGC GCTCGAAGAA CTGGGGCTCG CGCCCGCGTG GGTGCGGCGC 
GACGCGGCGC GCGCTGTGGA CGTGAACGAG GCGGCCGCGC ACGCGGCCGG AGAAACCGCG 
GTCGCGGCGG TTGCGCGAGG AGCGCAGCCG GCGTCGCCGG ATGCGCCGCG CGAGCCGGCG 
CGTCGGATCG CGCGCGATGG TGGGTGCGAC GGCGGGCAAG ACGGCGCGAG TGGCGACGCG 
GGATCGGCGT CGCCGAACGA CGCGGCGCAT GCGATGGCGC GTGTCGCGGG CGCGGAAGCG 
AGCGCAGCCG CCGCCGTCGC CGACGAACAC GCGGCGCTTG CGCGGCAGGC CGGCGACGGG 
CGCGGACAGG CGCGGCAAGC GGCGGCCGAA TCCGGCGTGC GGGCGGCGGC GGATGCGCCC 
GCGCCGGCCG CGGCGCCCGA ATCGCGAACG CGGGATGCGA CGATTGCGCG CGGGGCTTCG 
CCGGCTGAGC CGGAGGAGCC GGGCGTGGCA GGCGTGGTGG GCGTGGCGGA CGAGCCGAGC 
GTGGCGGGCG GCGCACGCCG CGCGCGGACG AGTGGCGGCG GCGCGGAGGT GCCGGCGAGC 
GCGCTTGACT TGACGGATGC GGCCGAGGCA ACGCGTCCGG CGGCGGCGCC CGCGCCGGCC 
GCGCTCACCG GTGGCGATGC CGGCGCGGCG GCGTCCGACG AGGACATGTC GTGGTTCGAT 
CTCGAACCGG TGCACGAGCC CGCGCTGCCG GACGTTGCCG CACGGCCCGC CGCCACTACG 
CCGTCCGTCG CCGAGCTCGG CTGGGACGAA CTGCGCGCGC GCGTCGCCGA CTGCGCGCGC 
TGCCGCCTCT GCGAAAAGCG CACGAACACG GTGTTCGGTG TCGGTGACGA GCACGCCGAC 
TGGATGCTCG TCGGCGAGGC GCCCGGCGAG AACGAGGACA AGCAAGGCGA GCCGTTCGTC 
GGCCAGGCGG GCAAGCTGCT CGACAACATG CTGCGCGCGC TGGCGCTCAA GCGCGGCGAG 
AATGTCTACA TCGCGAACGT GATCAAGTGC CGGCCGCCCG GCAACCGCAA TCCGGAGCCC 
GACGAGGTCG CGCGCTGCGA GCCGTATCTG CAGCGGCAGG TCGCGCTCGT GAAGCCGAAG 
CTGATCGTCG CGCTCGGCCG CTTCGCCGCG CAGACGCTGC TCAAGACGGA CGGAAGCATC 
GCTTCGATGC GCGGGCGCGT GCATCAGTAC GAAGGCGTGC CCGTGATCGT CACGTACCAT 
CCGGCGTATC TGCTGCGCAG CCTGCAGGAC AAGGCGAAGG CCTGGTCCGA TCTGTGTTTG 
GCGAACGATA CCTACCGGAG TGCCGCGCCC GCCGCCGATC CGCCATGA

Protein sequence

MAWTEAALEE LGLAPAWVRR DAARAVDVNE AAAHAAGETA VAAVARGAQP ASPDAPREPA 
RRIARDGGCD GGQDGASGDA GSASPNDAAH AMARVAGAEA SAAAAVADEH AALARQAGDG 
RGQARQAAAE SGVRAAADAP APAAAPESRT RDATIARGAS PAEPEEPGVA GVVGVADEPS 
VAGGARRART SGGGAEVPAS ALDLTDAAEA TRPAAAPAPA ALTGGDAGAA ASDEDMSWFD 
LEPVHEPALP DVAARPAATT PSVAELGWDE LRARVADCAR CRLCEKRTNT VFGVGDEHAD 
WMLVGEAPGE NEDKQGEPFV GQAGKLLDNM LRALALKRGE NVYIANVIKC RPPGNRNPEP 
DEVARCEPYL QRQVALVKPK LIVALGRFAA QTLLKTDGSI ASMRGRVHQY EGVPVIVTYH 
PAYLLRSLQD KAKAWSDLCL ANDTYRSAAP AADPP