Gene Namu_4236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4236
Symbol
ID	8449862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4696648
End bp	4698045
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	75%
IMG OID	645043285
Product	peroxidase, putative
Protein accession	YP_003203514
Protein GI	258654358
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2837] Predicted iron-dependent peroxidase
TIGRFAM ID	[TIGR01413] Dyp-type peroxidase family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0422414
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGCCG GCGAGCCCGA CCTCGATCAG CTGCAGGGGC TGCTGACCAG CGCATTTCCC 
CGCTCGCCGG CCGGCCGGTA CGTGCTGGTC GCCCTGCCGG ATGCCGAACG CGGGCGCGCC 
TGGCTGCGCT CGCTGCTGCC CATGATCACG TTCTCGGACG AGGTCGACCA GCAGATCCGG 
GCCCGGCGCG CCGCGGACCG GCCGGCCGTC AACGTGGCCT TCACCGCCGC CGGCCTCGCC 
GCCCTGGGCG TGCCGGCGGA CCGCACGGCG GACTTCTCCC GGGAATTCCG TGAGGGCATG 
GTCACCCCGC ACCGCCAGCG CATCCTGGGC GATCTGGACG GCTCGCCCAG CGACCCGCGC 
GGCTGGCGCT GGGGCGGGCC GGGCACCGAT CCGGTCCATG CGGTGCTGCT GCTCTTCGGG 
GCGGACGAGG CCGCCCTGGA CGACGTCGTA GGCGAGCTGC TCGGCGCGGC CACCGGGGTC 
CGGGTCGTGC ACACCGTCCC GACCGTGTCG ATCGCGGACG GCCGCGAGCA CTTCGGGTTC 
CGGGACGCGA TCGCCAGCCC CTGGGTGCCC GGGTTGCACC GGGATCGCGC GAAACGGGAC 
CGGGTCGCGG CCGGCGAGCT CGTCCTCGGC CGGCCCGACC TGACCGGGCA GCCGGAACCC 
TTCCCGCCGG TGGGCCGGGA CGGCAGCTAC CTGGTGATCC GCCAGCTGGC CCAGGACGTG 
CCCGGCTTCT GGACGGCCCT GCGGCAGTCG GTGGGCGACG CGCAGGCCGT GCGGTGGGCC 
GCGAAGATGA CCGGCCGCTG GCCGGACGGC ACCGCGCTGA TCCGCTCCCC CGGCGGCGCG 
GCGGCCGACC CGTCCGATGA TTTCGGTTAC CACGACGACC CGGACGGTGT CCGCTGCCCG 
CTGGGCGCCC ACATCCGGCG GGCCAACCCC CGCGACGGGT TGGGGACCCG GCCGGACGAG 
TCGATCCGGC TGGTGAACCG GCACCGGATC TTCCGCCGGG GCCGGCCGTT CGGCGCGGCG 
GCACCCTGGC CCACCTGGCC TGCCGGCATC GACCCGGTCG TCGTGGACAG CGGGCCGCCG 
GACGACAGCG GTGAGCGGGG GGTCGTTTTC GTCTGCCTCG GCGCCAGCCT GGCCCGGCAG 
TTCGAGTTCG TCACGCAGTC TTGGGTGAAC AACCCGAAGT TCGCCGGGCT CTACGACGAA 
GCCGACCCGA TCACCGGCGC ACCCCACCGG CGGATGTCCG GGTCGCGCGG GTCGGCGATC 
GGATTCGAGT TCACCGCGCC CGGGCCCGTC CTCAACGAGC GGATCGACCG GCCGGCCACC 
TACGTGCGCT GCGTCGGCGG CGGCTACTTC TTCCTGCCCG GCCGCCGCGG ACTGGCGCTG 
ATCGCCGCGG AGGCCTGA

Protein sequence

MTAGEPDLDQ LQGLLTSAFP RSPAGRYVLV ALPDAERGRA WLRSLLPMIT FSDEVDQQIR 
ARRAADRPAV NVAFTAAGLA ALGVPADRTA DFSREFREGM VTPHRQRILG DLDGSPSDPR 
GWRWGGPGTD PVHAVLLLFG ADEAALDDVV GELLGAATGV RVVHTVPTVS IADGREHFGF 
RDAIASPWVP GLHRDRAKRD RVAAGELVLG RPDLTGQPEP FPPVGRDGSY LVIRQLAQDV 
PGFWTALRQS VGDAQAVRWA AKMTGRWPDG TALIRSPGGA AADPSDDFGY HDDPDGVRCP 
LGAHIRRANP RDGLGTRPDE SIRLVNRHRI FRRGRPFGAA APWPTWPAGI DPVVVDSGPP 
DDSGERGVVF VCLGASLARQ FEFVTQSWVN NPKFAGLYDE ADPITGAPHR RMSGSRGSAI 
GFEFTAPGPV LNERIDRPAT YVRCVGGGYF FLPGRRGLAL IAAEA