Gene Moth_0946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0946
Symbol
ID	3832831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	978236
End bp	979177
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	63%
IMG OID	637828876
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_429805
Protein GI	83589796
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID	[TIGR03151] putative enoyl-(acyl-carrier-protein) reductase II

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00349563
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCGGA CACCCCTCTG CGATCTCCTG GGGATTACTT ATCCCATTAT TCAGGGCGGT 
ATGGCCTGGG TAGCAACGGG AGAGCTGGCG GCCGCTGTTT CGGCTGCCGG GGGACTGGGA 
ATTATCGGCG CCGGCAGTGC GCCGCCGGAT GTAGTTCGCC GGGAGATTCG CAAGGTACGG 
GAACAAACGG ACCGGCCCTT CGGGGTTAAT ATTTACTATC TATCACCTTA TGTCGAAGAA 
TTGGTTGATC TGGTATGCGA GGAAAGGGTG CCGGTGGTCA CCACCGGGGC CGGTAATCCG 
GGCAAGCACC TGCCCCGTTT CAAGGAGGCA GGGGTGAAGG TAATTCCGGT GGTAGCCTCG 
GTGGCCCTGG CGAAGAGGTT GGAGCGCCTG GGAGTGGACG CCCTGGTGGC CGAAGGCATG 
GAATGCGGCG GCCATATTGG AGAGATTGCC ACCATGCCCC TGGTGCCCCA GATTGTCGAT 
GCCGTACATA TCCCGGTGAT TGCTGCCGGC GGTATTGCCG ACGGACGCGG CCTGGCCGCC 
GCCCTGGCCC TGGGGGCCGC AGGCATCCAG ATGGGGACCA GGTTTATCTG CGCCACCGAG 
TGTACCGTCC ACGCCAACTA TAAAGAAGCG GTCCTCAAAG CCGGGGACCG GGACGCCGTC 
GTTACCGGTA TGGCCGGGCA CTATGTCCGG GTACTAAAGA ACAAGCTGAC CAGGCAGTTT 
GAGGAACTTT CCGCCCGGGG AGCGAGCTGG GAGGAGATGG ACCGCCTGGG AACCGGGAAG 
CTGCGGGCGG CGGCAGTCGA TGGCGATGTG GAGTACGGTT CAGTAATGGC CGGCCAGAGC 
GCGGCCATGG TGCGGGAAAT CAAGCCGGCA GCAGCCATCA TTGCGGAAAT CATGGCCGAG 
GCTGCTGAGG TTATAGCCCG GCTGGGCGCC TTGACAGGGT AG

Protein sequence

MLRTPLCDLL GITYPIIQGG MAWVATGELA AAVSAAGGLG IIGAGSAPPD VVRREIRKVR 
EQTDRPFGVN IYYLSPYVEE LVDLVCEERV PVVTTGAGNP GKHLPRFKEA GVKVIPVVAS 
VALAKRLERL GVDALVAEGM ECGGHIGEIA TMPLVPQIVD AVHIPVIAAG GIADGRGLAA 
ALALGAAGIQ MGTRFICATE CTVHANYKEA VLKAGDRDAV VTGMAGHYVR VLKNKLTRQF 
EELSARGASW EEMDRLGTGK LRAAAVDGDV EYGSVMAGQS AAMVREIKPA AAIIAEIMAE 
AAEVIARLGA LTG