Gene Saro_1176 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1176
Symbol
ID	3916473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1215757
End bp	1216803
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	71%
IMG OID	640443912
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_496455
Protein GI	87199198
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.829209
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCCTCG CACAGCGACT GGGCCTGCGG CATCCGCTGA TACAGGCACC GATGGCGGGG 
ACATCCACCC CCTCCCTTGC CGCTGCCGTG TGCGAGGCGG GCGCGCTGGG GTCCGTCGCG 
GTGGGTGCGG TCGATGCCGG GACGGCGCGA ACGATGATCG CCGACCTGCG GGCGCGGACC 
GCGCGGCCGT TCAACGTCAA TGCCTTCGTC CACCACAGGG CCCTGCGCGA CCTTGCGGCG 
GAACAGGCAT GGATCGCGGC GATGGCGCCG CTGTTCGAAC GGTTCGGGGC CGCGCCACCT 
GCCGCGTTGA ACGAGATCTA CCGTTCGCTG AACGACGATC CGGACATGCT GGCAGTGCTG 
GTGGAGGCCG CGCCTGCGGT GGTGAGCTTC CATTTCGGAC TGCCGACGGA CGAGGCCATC 
GCCGCGTTGA AGGCGCGTGG GTGCATGCTG ATGGCGAGCG CCACGTCGCT TGCCGAGGCC 
GAGGCGGCGG TCGCGGCCGG CATGGATGCG GTAGTCGCAC AAGGGTTCGA GGCGGGCGGC 
CACCGGGGCG TATTCGATCC CGAAGCGCCG GACGAACGGA TGCCGACGCT TGACCTGGTG 
CGGTTGCTGT CGTCCCGGCT GGACGTTCCC GTAATCGCGG CGGGCGGGAT CATGGACGGG 
GCGGACATAC GCCGCGCACT GGACGCCGGA GCGGATGCGG CACAACTTGG CACGGCATTC 
GTGGGCTGTC CCGAAAGCGC GGCGGACGCC GGCTATCGCG CGATGCTGGC GCGGGCCAAG 
GGCACGACGC TGACGGCGGC GATATCGGGG CGCCCCGCCA GGTGCCTCGA CAACGATTTC 
GTCGCGTGGG CGCGCGATAC CGATGCGCGC GTGCCCGGCT ATCCGGTGAC GTACGATGCC 
GGAAAGGCGC TGATCGCGGC GGCAAAGGGC GCGGGCGAAT GCGGGTTCGG CGCGCATTGG 
GCCGGAACGC AGTTCGCGCG CGCGCGGCCC ATGCCCGCAG GGGAACTGGT CATGCTTCTG 
GCGCAGGAGG CCGGGTTCGA TGCCTGA

Protein sequence

MRLAQRLGLR HPLIQAPMAG TSTPSLAAAV CEAGALGSVA VGAVDAGTAR TMIADLRART 
ARPFNVNAFV HHRALRDLAA EQAWIAAMAP LFERFGAAPP AALNEIYRSL NDDPDMLAVL 
VEAAPAVVSF HFGLPTDEAI AALKARGCML MASATSLAEA EAAVAAGMDA VVAQGFEAGG 
HRGVFDPEAP DERMPTLDLV RLLSSRLDVP VIAAGGIMDG ADIRRALDAG ADAAQLGTAF 
VGCPESAADA GYRAMLARAK GTTLTAAISG RPARCLDNDF VAWARDTDAR VPGYPVTYDA 
GKALIAAAKG AGECGFGAHW AGTQFARARP MPAGELVMLL AQEAGFDA