Gene Namu_4239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4239
Symbol
ID	8449865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4712374
End bp	4713993
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	73%
IMG OID	645043288
Product	PfaD family protein
Protein accession	YP_003203517
Protein GI	258654361
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID	[TIGR02814] PfaD family protein

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.354626
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTCGACA AGGCTCCGGC CGTGCCACTG GGCGGCTGGA CCGGGCCGAT AACGCCGGCT 
TTTGGGCCGA ACGAGGTCGC CGCGCTCACG CACCGTATCC GGGACACCGC GTTCGTCGTC 
GTCAACCCGG CGACCGGCGC GCACGGCGTC GTCACGCAGG GTGCTGCGGT GCCGGCGGAG 
ACGCCGGGTG CGCTGCGACT GGTCGGGGTG CTGCCGCCGC TGTACCCGGA GTGGCTCGGT 
GACCGGAACT TCACCCAGAC CCACGGGGTC CGTTTCCCCT ACGTCGCCGG GGAGATGGCC 
AACGGCATCG CCACCACGAC GATGGTCATC GAGATGGCCC GCCACGGCTA CCTGGGCTTC 
TTCGGGGCGG CCGGGTTGGA CGCCGGCCGG GTCGGCGCCG CGATCGACGA GTTGCACGCC 
GCCCTGGGCC GCGAGTCCAC GGCGTGGGGG AGCAACCTGA TCCACTCGCC GAACGAACCG 
GCCCTCGAAG AGGCCGTGGC CGAGCTGTAT CTGACCCGTG GGGTGCGCAA AGTATCGGCC 
AGCGCGTACA TGTCGCTCAC CCCGGCGATC GTGCGGTACG CCTACACCGG CGTCCGGGTC 
GACGCTTCCG GCACCATCCA CCGGCCGAAC ATGGTCTTCG CCAAGGTGTC CCGGCCCGAG 
GTGGCCCGGC AATTCCTGGA ACCGGCACCG GCGGCGATGC TGGCCGGGCT GGTCGACGCC 
GGCCGGCTCA CCCCGGACGA GGCGCGGCTG GCCGCCGGGC TGCCGGTCGC CGAGGACATC 
ACCGTGGAGA GCGACAGTGG CGGCCACACC GACAACCGGC CGCTGGCGCC GCTGTTCGCC 
GCCATCGCCG CCGTCCGCGA CGAGGTGGTG GCGGCCCGCG GGTACCGGCG TCCGGTTCGG 
TTGGGCGCCG CCGGCGGGAT CGGCACCCCG CAGGCGGTGG CCGCGGCCTT CGCCCTGGGC 
GCGTCCTACG TGCTGACCGG GTCGGTCAAC CAGGCCTGCG TCGAGGCCGG GATCGCGGCC 
GACGCCAAAG CCATGCTGGC CGCCGCGGAC ATCGCCGACG TCACGATGGC ACCGGCCGCC 
GACATGTTCG AGCTCGGGGT GTCCCTGCAG GTGCTGCGGC GGGGGACCAT GTTCGCGAGC 
CGCGCCCGCA AGCTCTCCGC GCTCTATCGC GCGCATCCCA GCCTGGAGGC GATCGCCCCG 
GCGGAGCTGG CCGCCCTGGA GAAGCAGATC CTGGGCCAGT CCGTCGCCGA CTGCTGGACG 
CAGACCCGCG CGTTCTGGCT GGAGCGGGAC CCCGAGCAGG TCAGCCGGGC CGAGGCCGAC 
CCGCGGCACC GGATGGCGCT GGTGTTCCGC AGCTACCTGG GCCTGTCCAG CCGCTGGTCG 
ATCGAGGGCC GCGCCGAGCG CCGGCTGGAC TACCAGATCT GGTGCGGCCC GGCGATGGGT 
GCGTTCAACG CGTGGACGGC CGGATCGTTC CTGGCCGAAC CGGGGAACCG GACCGTTAGC 
CAGGTCGCGC ATAACCTGAT GGAAGGGGCG GCGGTGCTGA CCCGGGCCCA GCAGCTGCGC 
ACCTTCGGGG TGGCAGTGCC GCCCGAGGCC TTCACCTACC GTCCCCGGCT CTTGCGGTGA

Protein sequence

MLDKAPAVPL GGWTGPITPA FGPNEVAALT HRIRDTAFVV VNPATGAHGV VTQGAAVPAE 
TPGALRLVGV LPPLYPEWLG DRNFTQTHGV RFPYVAGEMA NGIATTTMVI EMARHGYLGF 
FGAAGLDAGR VGAAIDELHA ALGRESTAWG SNLIHSPNEP ALEEAVAELY LTRGVRKVSA 
SAYMSLTPAI VRYAYTGVRV DASGTIHRPN MVFAKVSRPE VARQFLEPAP AAMLAGLVDA 
GRLTPDEARL AAGLPVAEDI TVESDSGGHT DNRPLAPLFA AIAAVRDEVV AARGYRRPVR 
LGAAGGIGTP QAVAAAFALG ASYVLTGSVN QACVEAGIAA DAKAMLAAAD IADVTMAPAA 
DMFELGVSLQ VLRRGTMFAS RARKLSALYR AHPSLEAIAP AELAALEKQI LGQSVADCWT 
QTRAFWLERD PEQVSRAEAD PRHRMALVFR SYLGLSSRWS IEGRAERRLD YQIWCGPAMG 
AFNAWTAGSF LAEPGNRTVS QVAHNLMEGA AVLTRAQQLR TFGVAVPPEA FTYRPRLLR