Gene BURPS668_2694 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2694
Symbol
ID	4882067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	2666104
End bp	2667348
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	69%
IMG OID	640128622
Product	2-nitropropane dioxygenase family oxidoreductase
Protein accession	YP_001059718
Protein GI	126439626
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCCGCC CCTTTCAGGA ATTTGCCGTG TCCGTGTCCG TCGTCAAAAC CGCATTCAAG 
AATCTCGTGA TCAAGGGCAG ATCGCTGCTG CCGATTGTGC AGGGCGGGAT GGGCGTCGGC 
GTGTCCGCGC ACCGGCTCGC CGGCACGGTC GCGTCGCTCG GCGCGTGCGG GACGATCTCG 
AGCGTCGACC TGCGTCGGCA TCATCCCGAC CTGATGGCGC GCACCGGCCG CTCGCGCGAT 
CGCGCGCTCA TCGACGCGGC GAACCTCGAA GCGCTCGATC GCGAGATCCG CGCGGCGAAG 
TCGCTCGCGA ACGGCCGCGG GCTCGTCGCC GTCAACGTGA TGCGCGCGCT GTCCGAATAC 
GCTTCGTATG TGCGCCAGTC GTGCGAGAGC GGCGCGCACG CGGTCGTCGT CGGCGCCGGG 
CTGCCGCTCG ACTTGCCCGA GCTGACCGCC GATTTTCCCG ACGTCGCGCT GATTCCGATC 
CTGTCGGACG CACGCGGAAT CGGGCTCGTG CTGAAGAAGT GGATGCGCAA GAACCGTCTG 
CCCGACGCCG TCGTCATCGA GAACCCACGC TACGCGGCGG GCCACCTCGG CGCGCCGACG 
ACCGACAGCC TGAACAACCC GAATTTCGCG TTCCCCACGG TGCTCGAAGG CACGTTCGCG 
CTGCTCAAGG AGCTCGGCAT CGAGCGCGAG CGGATTCCGC TGATCGCGGC GGGCGGCATT 
CACAGCCACG AGCAGGTGCG TCAACTGTTC GCGCTCGGCG CGAGCGCCGT GCAGCTCGGC 
ACGCCGTTCG CGGTGACCGA AGAGGGCGAC GCGCATCCGA ACTTCAAGAA AGTGCTCGTC 
GAGGCGCAGC CGGACGACAT CGTCACGTTC ATGAGCGTCG CGGGGCTGCC GGCGCGCGCG 
GTGCGCACGC CGTGGCTCAC GAACTATCTG GAACGGGAAC GGAAGCTGCA GCGTGCGGCG 
AAGCCGCGCA AATGCCTCGT CGGCTTCGAT TGCCTGCAGC AATGCGGGCT GCGCGACGGC 
ATCGAGAAGC ACGGCCAGTT CTGCATCGAC ACCCGGCTCG CGTTCGCGCT CGCGGGCGAC 
ATCAAGCGCG GGCTGTTCTT CCGCGGCTCG GAAACCTTGC CGTTCGGTCA CGAGATCCGC 
TGCGTGCGCG AGCTGATCGA CTATCTGCTC ACGGGCGTCA AGCGTGCGGC CGCCGCGGCG 
ATCGCCCCCG CGACGGCGTG CGCGCCCATG CCCGCGCTGG GCTGA

Protein sequence

MSRPFQEFAV SVSVVKTAFK NLVIKGRSLL PIVQGGMGVG VSAHRLAGTV ASLGACGTIS 
SVDLRRHHPD LMARTGRSRD RALIDAANLE ALDREIRAAK SLANGRGLVA VNVMRALSEY 
ASYVRQSCES GAHAVVVGAG LPLDLPELTA DFPDVALIPI LSDARGIGLV LKKWMRKNRL 
PDAVVIENPR YAAGHLGAPT TDSLNNPNFA FPTVLEGTFA LLKELGIERE RIPLIAAGGI 
HSHEQVRQLF ALGASAVQLG TPFAVTEEGD AHPNFKKVLV EAQPDDIVTF MSVAGLPARA 
VRTPWLTNYL ERERKLQRAA KPRKCLVGFD CLQQCGLRDG IEKHGQFCID TRLAFALAGD 
IKRGLFFRGS ETLPFGHEIR CVRELIDYLL TGVKRAAAAA IAPATACAPM PALG