Gene Rru_A3787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A3787
Symbol
ID	3837244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	+
Start bp	4337976
End bp	4339373
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	66%
IMG OID	637827912
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_428868
Protein GI	83595116
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAGATA TCAAACCGCT CCTGATATCG GGCAAGGAAG TGTATCCCCT GGTCGAAGGC 
GGCAAGGGCG TTGCGGTGAC GAACGGCCGC AGCTCGGGCG CCTGGGCGGC CGCTGGTGGT 
GTTGGCACCA TCAGCGCGGT GAATGCCGAT TTTTATGACG AGACCGGCGC CCTGGCCAAT 
CAGGTTTACA AGGGGCGGAC GCGCAGCGAA CGCCACCGCG AGCTGATCGA CTTCGGCATC 
AAGGGCGGCA TCGTCCAGGC CCGCATCGCC CACGAGGAAG CGCGCGGCGA AGGGCGGATG 
CACATCAACG TCCTGTGGGA AATGGGCGGG GCCCGCGAGG TTCTCGAAGG CGTGCTCGAA 
GGCGCCAAGG GCCTGGTCCA TGGCGTGACC TGCGGCGCCG GCATGCCCTA TGGCGTGGCC 
GAGATCGCCG CCCGCCACCG CGTCTATTAC TATCCCATCG TGTCGTCGGC CCGCGCCTTC 
CGCGCCCTGT GGAAGCGGGC CTATAGCAAG GCCCCCGAAT GGCTGGGCGG CGTCGTCTAT 
GAGGATCCCT GGCTGGCCGG CGGCCACAAT GGCCTGTCCA ACAGCGAAAA CCCGCGCGAA 
CCCCAGCCGC CCCTGCCGCG CGTCGCCGAA TTGCGCGCCC AGATGCGCGC CGTCGGCGCT 
CCCGAGGTGC CGATCATCAT GGCCGGCGGC GTGTGGTATC TGCGCGAATG GGCCGAATGG 
CTTGAAAACC CCGAGCTGGG GCCGATCGCC TTCCAGTTCG GCACCCGGCC GCTGCTGACC 
CAGGAAAGCC CGATTTCCGA CGAGTGGAAG CAGCGCCTGC TGACCTTGCG TCCGGGCGAC 
GTGTTGCTCC ATCGCTTCAG CCCGACGGGG TTCTACTCCT CGGCCGTGCG CAATGACTTC 
CTTCAGGAAC TGGTCGAGCG CTCCAACCGC CAGATCACCT ATTTCACCGA GCCCCAGGGC 
CAGCACACCA CCAGCTTCGC CGTCGGCCCG CGCGCCCGCG AGGTGTTCGT GCGCGCCGAG 
GATAGCGTTC TGGCCCATGC CTGGGTCGCC CAGGGCTTCA CCGAAGCCAT GCGCACGCCC 
GATAACTCGC TGATCTTCGT CACGCCCGAG CGCGCCGAGC GCATCAAGAC CGACCAGATC 
AATTGCATGG GCTGCCTGTC GGCCTGCGGG TTCTCGAACT GGGCGGAGAA CGAGTTGAAC 
AACACCGGCA AGCGCGCCGA CCCCCGCTCG TTCTGTATTC AAAAGACCCT CCAGGAAATC 
GCCCACGGCC ACCCCGTCGA CCAGAACCTG ATGTTCGCCG GCCATAACGC CTTCCGCTTC 
GCCACCGATC CGTTCTTCAC TTCGGGACGG ATTCCGACCA TGGGCGAGTT GGTCGAGCGC 
ATCCTGACGG GCGATTGA

Protein sequence

MKDIKPLLIS GKEVYPLVEG GKGVAVTNGR SSGAWAAAGG VGTISAVNAD FYDETGALAN 
QVYKGRTRSE RHRELIDFGI KGGIVQARIA HEEARGEGRM HINVLWEMGG AREVLEGVLE 
GAKGLVHGVT CGAGMPYGVA EIAARHRVYY YPIVSSARAF RALWKRAYSK APEWLGGVVY 
EDPWLAGGHN GLSNSENPRE PQPPLPRVAE LRAQMRAVGA PEVPIIMAGG VWYLREWAEW 
LENPELGPIA FQFGTRPLLT QESPISDEWK QRLLTLRPGD VLLHRFSPTG FYSSAVRNDF 
LQELVERSNR QITYFTEPQG QHTTSFAVGP RAREVFVRAE DSVLAHAWVA QGFTEAMRTP 
DNSLIFVTPE RAERIKTDQI NCMGCLSACG FSNWAENELN NTGKRADPRS FCIQKTLQEI 
AHGHPVDQNL MFAGHNAFRF ATDPFFTSGR IPTMGELVER ILTGD