Gene RPD_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2021
Symbol
ID	4022503
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2266957
End bp	2267952
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	65%
IMG OID	637962214
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_569157
Protein GI	91976498
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.01256
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.586253
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAAGA CGCGTTTTAC CGAAACATTC GGCATCCAGC ATCCGATCGT CCAGGGCGGG 
ATGCAGTGGG TCGGCCGCGC CGAACTCGTG GCCGCTATCG CCAATGCCGG CGCGCTCGGC 
ATGATCACCG CGCTGACGCA GCCGACGCCG GAGGATCTCA CCAAGGAGAT CGCGCGCTGC 
CGTGACCTCA CCGACAAGCC GTTCGGCGTC AACCTCACGA TCCTGCCGGC GATCAAGCCG 
CCGCCTTATG CGGAGTATCG TCAGGCGATC ATCGAGAGCG GCGTCAGGAT CGTCGAGACC 
GCGGGCAACA AGCCGCAGGA GCACGTCGAG GAATTCAGAA AGCACGGCGT CAAGGTTCTG 
CACAAATGTA CCAGCGTCCG CCACGCGCTG TCGGCGGAGC GGATGGGCGT CGACGGCATT 
TCGATCGACG GTTTCGAATG CGCCGGCCAC CCGGGCGAAG ACGATACGCC CGGCCTGATC 
CTGATCCCCG CCGCCGCCGA CAAGATCAAG GTCCCGATGA TCGCCTCGGG CGGCTTCGCC 
GATGGGCGCG GCCTGGTCGC GGCGCTGGCG CTCGGCGCCG ACGGCATCAA CATGGGCACG 
CGATTCATGT GCACCAAAGA GAGCCCGATC CATCAGGCGG TGAAGGAAAA GATCGTCGCC 
AATGACGAGC GCTCGACCGA CCTGATCTTC CGCACCATGC GCAACACCTC GCGCGTCGCG 
AAGAACGCGA TCAGCCAGCA GGTGATCGAG CTAGAGAAGC AGGGCGCGAC CTTCGAGCAG 
GTCCGCGAAC TGGTCGCCGG CGCCCGCGGC AAGATGGTCT ACGCTACCGG CGACACCGAT 
GAAGGCGTGT GGTCGGCCGG TCAGGTCCAG GGACTGATTC ATGACATTCC GAGCTGCGCC 
GAGCTGGTGT CGCGGATCAT GCGCGACGCC GAGGCGATCA TTCGTGCGCG GCTCGAAGCG 
ATGCTGTCGG GCGGCCAGCG CGAAGCCGCC GAATGA

Protein sequence

MIKTRFTETF GIQHPIVQGG MQWVGRAELV AAIANAGALG MITALTQPTP EDLTKEIARC 
RDLTDKPFGV NLTILPAIKP PPYAEYRQAI IESGVRIVET AGNKPQEHVE EFRKHGVKVL 
HKCTSVRHAL SAERMGVDGI SIDGFECAGH PGEDDTPGLI LIPAAADKIK VPMIASGGFA 
DGRGLVAALA LGADGINMGT RFMCTKESPI HQAVKEKIVA NDERSTDLIF RTMRNTSRVA 
KNAISQQVIE LEKQGATFEQ VRELVAGARG KMVYATGDTD EGVWSAGQVQ GLIHDIPSCA 
ELVSRIMRDA EAIIRARLEA MLSGGQREAA E