Gene TM1040_2459 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2459
Symbol
ID	4076941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2601478
End bp	2602539
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	63%
IMG OID	638007783
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_614453
Protein GI	99082299
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.36207
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGG GAGAGGCTTT TCTGGATCGT CTTGGGATTT CGCTGCCTCT GATACAGGCG 
CCGATGGCCG GGGTCTCAAC TCCGAGGCTC GCAGCAGCAG TGACGGACGC CGGCGCGCTT 
GGTTCGATCG GGGTGGGGGC CCTGGATGCT AGCGCGACTC GCAAGCAGAT CGAAGAGCTG 
CAGCATCTGA CCAATGGGCC CTTCAATGTG AATTTCTTTT GCCATCAGAC GCCGCAGCGC 
AACCCTGAGA TCGAGGGTCG CTGGATCCAA CGCAGCGCGC CTTTGTTTGC CCGCATGCAG 
GCGGAGCCAC CCAAAGAGCT ATCTGAAATA TATACCAGTT TTCGGGATAC AGACGCATTT 
CTCGAGGCGG TGCTGGACCT GCGGCCTGCG GTGGTGAGTT TCCACTTTGG TTTGCCCAAG 
CCCCATCAGA TCAGCGCCAT GAAGGCCGCA GGGCTGACAC TGCTGGCGAG CGCCACCTCG 
CTGGAGGAGG CCCGCCAGAT CGAAGCGGCG GGGCTGCATG GGATCATAGC ACAAGGGTGG 
GAGGCCGGCG GCCACCGGGG TGTTTTTGAA CCTGGCGCCT TGGATGCACG CCTTGGCCTG 
CTGGAGCTGG TTGCGGTGCT GGCCGAACAG ACCACCCTGC CGGTGATCGC AGCCGGTGGC 
CTGATGACGG GCGCGGAGAT CGCGCGGGCG CTCTCGGCGG GGGCAGTCGC GGCACAGCTC 
GGCACCGCGT TTATCGGCTG CCCGGAGAGC AACGCCGATG CTGCCTATCG GGACAGGCTG 
GCGCTTGGAG ATGAGACGGT GATGACCGCA GCGATCTCCG GTCGTCCGGC GCGATGTCTC 
AGCAATGCCT TCACCGAATG GGCCTCAGAT GTCCCGATTG CAGAAATTCC AGCCTACCCA 
TGCGCTTATG ATCTTGGCAA AGCCCTGAAT GCAGTGGCAA CGGCCAAGGG CGTCAGCAGT 
TTTGGCTCGC AGTGGGCAGG CATGGGCGCA GATCGCGCTC GGTTTATGCC CGCGCAGGCC 
CTGGTGCAGA CCTTGATGGC TGAACTTGCC GCTACAATCT GA

Protein sequence

MTKGEAFLDR LGISLPLIQA PMAGVSTPRL AAAVTDAGAL GSIGVGALDA SATRKQIEEL 
QHLTNGPFNV NFFCHQTPQR NPEIEGRWIQ RSAPLFARMQ AEPPKELSEI YTSFRDTDAF 
LEAVLDLRPA VVSFHFGLPK PHQISAMKAA GLTLLASATS LEEARQIEAA GLHGIIAQGW 
EAGGHRGVFE PGALDARLGL LELVAVLAEQ TTLPVIAAGG LMTGAEIARA LSAGAVAAQL 
GTAFIGCPES NADAAYRDRL ALGDETVMTA AISGRPARCL SNAFTEWASD VPIAEIPAYP 
CAYDLGKALN AVATAKGVSS FGSQWAGMGA DRARFMPAQA LVQTLMAELA ATI