Gene RPD_1859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1859
Symbol
ID	4022341
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2079765
End bp	2080898
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	66%
IMG OID	637962052
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_568995
Protein GI	91976336
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.468508
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCGC CGATCTGCGA GATGCTGGGC ATCGAGTTTC CGCTGCTCGC GTTCAGCCAT 
TGCCGCGACG TGGTCGCAGC CGTCAGCCGC GCCGGCGGAT TTGGTGTGCT GGGCGCCACC 
ATTCACACGC CGGAGACGAT CGAGCAGGAA CTGAAATGGA TCGACGATCA TGTCGACGGC 
AAGCCCTATG GGCTCGACGT GCTGATCCCG GAGAACATCT CGACCGCCGG CGAAAAGGAT 
GTCACCTGGC AGAGCCTCGA GACGCGCATC GGCCCGGAGC ATCGCGATTT CACTCGCGAC 
CTGCTGAAGA AGTACAATAT CGACTACAAG CCCGTGCCGG TCCCGGCGAA CCAGCCGCAG 
CCGTTCGACG CGCAATGTGC GCTCGAAGTG CTCGAGGTCT CGTTCAGCCA TCCGATCCGG 
TTGATCGCCA ATGCGCTCGG CGTGCCGCCC AAGGCGATGA TCGACATGGG CAGGAAACAC 
GGCGTGCCAG TGGCGGCATT GGTCGGCGCC AAGGAACACG CGATCCGGCA GGTCGCGGCT 
GGCGTCGACA TCATCGTCGC GCAGGGCACC GAGGCCGGCG GGCATTGCGG CGAGGTGTCG 
ACGATGGTGT TGGTGCCGGA GGTGATCAAG GCGATCAAAC CGATCCGCGA GGTGCCCGTG 
CTCGCCGCGG GCGGCATCAT GACCGGGCGG CAGATGGCGG CCTGCATGGC GATGGGCGCT 
GCCGGTGCGT GGACCGGCTC GGTTTGGCTG GCAACGGTGG AATCCGAAAC CAGCGAGACG 
TTCCGCGAGA AGATGATCGC CGCCTCGTCG CGCGACGCTG TGCGCTCGAA GGGCCGCACC 
GGCAAGCCGG CGCGACAGTT GCGCTCGGTG TGGACCGACG CGTGGGATCG CGGCCCGGAC 
AGCCCGGGCG CGTTGCCAAT GCCGCTGCAG TCCATCATCA GCCGCGACGC CTTCATCGCG 
ATCGATCGCG CCGCCGCGGC CGGCAGTGCG CAGGCGCGCG ATCTGGTCAG CTACTTCGTC 
GGCCAGGGTG TCGGCCTGAT CGACAGCGTC AAGAGCGCCG GCGCCGTGGT TCAGGAATTC 
AAACAGGACT TCGCCGAGGC GGTCGAACAT CTCGACGCGC TGGTGGCGAG TTGA

Protein sequence

MKSPICEMLG IEFPLLAFSH CRDVVAAVSR AGGFGVLGAT IHTPETIEQE LKWIDDHVDG 
KPYGLDVLIP ENISTAGEKD VTWQSLETRI GPEHRDFTRD LLKKYNIDYK PVPVPANQPQ 
PFDAQCALEV LEVSFSHPIR LIANALGVPP KAMIDMGRKH GVPVAALVGA KEHAIRQVAA 
GVDIIVAQGT EAGGHCGEVS TMVLVPEVIK AIKPIREVPV LAAGGIMTGR QMAACMAMGA 
AGAWTGSVWL ATVESETSET FREKMIAASS RDAVRSKGRT GKPARQLRSV WTDAWDRGPD 
SPGALPMPLQ SIISRDAFIA IDRAAAAGSA QARDLVSYFV GQGVGLIDSV KSAGAVVQEF 
KQDFAEAVEH LDALVAS