Gene Namu_4911 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4911
Symbol
ID	8450542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5481257
End bp	5482582
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	71%
IMG OID	645043950
Product	Dyp-type peroxidase family
Protein accession	YP_003204174
Protein GI	258655018
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2837] Predicted iron-dependent peroxidase
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence [TIGR01412] Tat-translocated enzyme [TIGR01413] Dyp-type peroxidase family

Plasmid Coverage information

Num covering plasmid clones	49
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGC AGGGCACCTC ACGTCGGCGG TTCTTCACCG GGGCCGCCGG CCTGGGCGTG 
GCCGCCGGCG TCGGGGTCGG CGTCGGGGTG GCGACCGGGT ACGGCATCCG GGCTGCGACC 
GAGGCCAACG CCGCGTCGAC CGACCCCGGC TCGACCGGCG CAGCCTCGAC CGACCCCGAT 
GCGCAGGCCA ACGCGATCGT CCCGTTCTAC GGAGCGCGGC AGGCCGGGAT CGTCACCCCG 
CAGCAGGAGC GGCTGATGTT CGCCGCCTTC GACGTGAGCA CCACCGACGT CGAGGAACTC 
AAGCGGATGC TCGGCCGGTG GGCGGCGATG GCCGCGCGGA TGACGCAGGG CAAGCAGGTC 
AGCGACTCGC CGACCAAGCC GGCCCAGCCG CCGTTCGACA CCGGCGAGGC GATGGATCTG 
GGCGCGCACT CGCTGACCAT CACCGTCGGC TTCGGCCCCA GCCTGTTCGA CGACCGCTTC 
GGGCTGGCCG ACCGGATGCC GCCCGAGCTG ACCGCCTTCG GCACCATTCC CGGTGACGCG 
GTGATGCGGG CCGAGCTGTC CGACGGCGAC CTGTGCGTGC AGGCCTGCGC GGACGATCCC 
CAGGTGGTCT TCCACGCCAT CCGCAACCTG GCCCGGGCGG CCCGCGGCAC CGCCACCCTG 
CGCTGGTCGC AGCTGGGCTT CGGGCGGGCG TCCTCGACCG GGTCGCAGCA GGTCACCCCG 
CGCAACCTGA TGGGCTTCAA GGACGGCACC CGCAACGTGC GGGCCGACGA CACCGCGACC 
CTGGACGCGC ACGTGTGGGT GGGCGCGAAC GGCGCGTCCC TGGCCCCCGA GCACGAGTGG 
ATGCGGGGCG GCTCCTACCT GGTCGCCCGC AAGATCCGGA TGGAGATCGA GTCCTGGGAC 
ACCGATCCCC TGGAGGACCA GGAGAAGATC TTCGCCCGGT TCAAGGACAC TGGGGCGCCG 
CTGACCGGGG GTGACGAGTT CACCGCGCCC GACTACGCCA AGCTCGGCGA CAACGGTCAG 
CCGGTGATCG ACATCGACGC CCACATCCGG CTGGCCTCGC CGGAGCAGAA CAACGGCCTG 
ACCATCCTGC GTCGCGGCTA CAACTACACC GACGGCCAGG ACCCGGCCAC CGGCAAGCTC 
GCCGCCGGCC TGTTCTTCAT CGCCTACCAG CGGGACCCGC AGACCCAGTT CAAGGTGCTG 
CAGACCCGGC TGGGCAAGAG CGATCTGCTC AACGAGTACA TCGCCCACAT CGGCGGCGGC 
CTGTGGGGCT GCCCGCCGGG AGTCAGCGCG CCGGGCGACT GGTTCGGCAA GTCTCTTTTC 
ACCTGA

Protein sequence

MTEQGTSRRR FFTGAAGLGV AAGVGVGVGV ATGYGIRAAT EANAASTDPG STGAASTDPD 
AQANAIVPFY GARQAGIVTP QQERLMFAAF DVSTTDVEEL KRMLGRWAAM AARMTQGKQV 
SDSPTKPAQP PFDTGEAMDL GAHSLTITVG FGPSLFDDRF GLADRMPPEL TAFGTIPGDA 
VMRAELSDGD LCVQACADDP QVVFHAIRNL ARAARGTATL RWSQLGFGRA SSTGSQQVTP 
RNLMGFKDGT RNVRADDTAT LDAHVWVGAN GASLAPEHEW MRGGSYLVAR KIRMEIESWD 
TDPLEDQEKI FARFKDTGAP LTGGDEFTAP DYAKLGDNGQ PVIDIDAHIR LASPEQNNGL 
TILRRGYNYT DGQDPATGKL AAGLFFIAYQ RDPQTQFKVL QTRLGKSDLL NEYIAHIGGG 
LWGCPPGVSA PGDWFGKSLF T