Gene Namu_0597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0597
Symbol
ID	8446181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	657842
End bp	658858
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	75%
IMG OID	645039730
Product	2-nitropropane dioxygenase NPD
Protein accession	YP_003200001
Protein GI	258650845
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGGAC TGGTCGATCT CGCGGTGGCC GCGACGGTCC TGGCCGCACC GATGGCCGGC 
GGGCCGAGCA CGCCCGATCT GGTGACGGCC ACCGCCGCGG CCGGCAGCCT GGGGTTCCTG 
GCCGGCGGAT ACCGGACCGC GGCCCAGCTG GCCGCGCAGA TCGCCGAGGT TCGGGCGATC 
ACCCCGACGT TCGGGGTGAA TCTGTTCGCG CCCAACCCGA TTCCGGTCGA CCCCCAGGCC 
TACGCGCAGT ACGCCGCCCG GTTGGCCGAG CGGGCGGACC ACTTCGGTGT CGTGTTGCCG 
CCCCGGCCCA TCGAGGACGA CGACGGCTGG CCGGACAAAC TCGACCTGCT GATCGAGGAC 
CCGGTGCCGC TGGTCAGCTT CACGTTCGGG CTACCGCCGG CCAGGGCGAT CCGGGCCCTG 
CAGCGCGCCG GCAGCGCGGT CGCCCAGACG GTGACCGGCC CCGCGGAAGC GCGCTGGGCG 
CTGGACGCCG GAGCCGACCT GCTCATCGTG CAAAGCGCCG ACGCCGGCGG GCATTCCGCG 
GTCTTCGATC CCTCGGTCCG CCCGCCATCC CCGGCGCTGC CGGACCTCAT CCGGCAGATC 
GCGGCGACCA CACCGCGGCC GCTGATCGCG GCCGGCGGGT TGTCCTCGGC CGACCGGGTG 
GCGGCGGCGC TCCGGGCGGG CGCGGCCGCC GTCATGGTCG GCACGGCCTT GCTGCTGGCG 
GACGAGGCCG GGACCTCGGC CGTGCATCGG GCGGCGATCG CCGGGCGTCC CGGTCCGACC 
GTGATCACCC GGGCGTTCAC CGGTCGCCCG GCCCGCGGAC TGGTCAACGA GTTCATCGTG 
CAGTTCGAAC CACGGGCGCC GCTGGGCTAC CCGGCCCTGC ACCACCTGAC CAGCCCGCTG 
CGCAAGGCCG CGGCCGCCGC CGGCGATCCG GAATGGGTGC ACCTGTGGGC CGGAACCGGC 
CACGGCGCCG TCACTCCCGG GCCGGTCGCC GACATCCTGC GGCGCCTGGC CGTCTGA

Protein sequence

MSGLVDLAVA ATVLAAPMAG GPSTPDLVTA TAAAGSLGFL AGGYRTAAQL AAQIAEVRAI 
TPTFGVNLFA PNPIPVDPQA YAQYAARLAE RADHFGVVLP PRPIEDDDGW PDKLDLLIED 
PVPLVSFTFG LPPARAIRAL QRAGSAVAQT VTGPAEARWA LDAGADLLIV QSADAGGHSA 
VFDPSVRPPS PALPDLIRQI AATTPRPLIA AGGLSSADRV AAALRAGAAA VMVGTALLLA 
DEAGTSAVHR AAIAGRPGPT VITRAFTGRP ARGLVNEFIV QFEPRAPLGY PALHHLTSPL 
RKAAAAAGDP EWVHLWAGTG HGAVTPGPVA DILRRLAV