Gene BURPS1710b_2314 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_2314
Symbol
ID	3689931
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	-
Start bp	2580938
End bp	2582128
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	69%
IMG OID	637728771
Product	2-nitropropane dioxygenase
Protein accession	YP_333710
Protein GI	76810674
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGGTT CCATTCCCTT TCCGCCGCTG ATGATCCGCG GCCGTTCGCT GTTGCCCATC 
GTGCAGGGCG GGATGGGCGT CGGCATCTCC GCGCATCGGC TCGCCGGAAG CGTCGCGCGC 
GAAGGCGCGC TCGGCACGAT CGCGAGCATC GACTTGCGCC ATCACCATAC CGATCTGATC 
GAGCGCTGCA AGCAGCATCC GGATCGCGAG ACGATGGAGG CGGCGAACCT CGAGGCGCTC 
GCGCGCGAGA TCCAGCGCGC GAAGACGTGG GGCGAGGGGC GCGGCATGAT CGCGGTCAAC 
GTGATGAAGG CGGTGCGCTC GCACGCCGAC TATGTGCGCA TCGCATGCGA GTTCGGCGCG 
GACGCGATCG TGATGGGCGC GGGCTTGCCG CTCGATCTGC CGGACATGAC GCAGGGGCAC 
GACATCGCGC TGATCCCGAT CCTGTCGGAC AGCCGCGGCA TCGCGCTCGT GCTGAAGAAG 
TGGATGAAGA AAGGGCGTCT GCCCGATGCG ATCGTGATCG AGCATCCGGC CCGCGCGGGC 
GGCCATCTCG GCGTGACGAG CCTCGACGAC ATGGACGATC CGCGCTTCGA ATTCGCGCGG 
GTCATCGACG AAACCCGGCA GACGTTCGCC ACGCTCGGCC TCGAGCGCGA GCGCATCGCG 
CTCGTCGTCG CGGGCGGCAT CAACAGCCAC GAGGCGGTGC GCGCGGCGCT CGCCGAAGGC 
GCGAACGGCG TGCAGGTGGG CACGCCGTTC GCGGTCACCG AGGAGGGCGA TGCGCATCCG 
AACTTCAAGC GCGTGCTCGC GAACGCGAAG CCGGACGACA TCGTCGAGTT CTTGAGCGTC 
ACGGGGCTGC CGGCGCGCGC GGTGAAGACG CCGTGGCTCG AGCGTTATCT GCGGCACGAG 
ACGCGCATTC GCGCGAAGAT CGGCGCGCTC AAGCAGCGCT GCCCGTCGGC GCTCGAATGC 
CTGAGTGTGT GCGGCTTGCG CGACGGCATC GAGCGCTTCG GCCACTTCTG CATCGATACG 
CGCCTGGCCG CCGCGCTGCG CGGCGACGTC GCGAACGGGC TGTTCTTCCG CGGCCGCGAA 
GCGCTGCCGT TCGGGCAGGC GATTCGCAGC GTGCGCGATC TGCTCGAGCT GCTGCTCACG 
GGCACCGCAC CCGAAGCTGC GGCAAACCGT CCCACTTTCT CGTTGTCGTA A

Protein sequence

MTGSIPFPPL MIRGRSLLPI VQGGMGVGIS AHRLAGSVAR EGALGTIASI DLRHHHTDLI 
ERCKQHPDRE TMEAANLEAL AREIQRAKTW GEGRGMIAVN VMKAVRSHAD YVRIACEFGA 
DAIVMGAGLP LDLPDMTQGH DIALIPILSD SRGIALVLKK WMKKGRLPDA IVIEHPARAG 
GHLGVTSLDD MDDPRFEFAR VIDETRQTFA TLGLERERIA LVVAGGINSH EAVRAALAEG 
ANGVQVGTPF AVTEEGDAHP NFKRVLANAK PDDIVEFLSV TGLPARAVKT PWLERYLRHE 
TRIRAKIGAL KQRCPSALEC LSVCGLRDGI ERFGHFCIDT RLAAALRGDV ANGLFFRGRE 
ALPFGQAIRS VRDLLELLLT GTAPEAAANR PTFSLS