Gene Namu_5006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5006
Symbol
ID	8450637
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5584504
End bp	5585748
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	74%
IMG OID	645044044
Product	Dyp-type peroxidase family
Protein accession	YP_003204268
Protein GI	258655112
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2837] Predicted iron-dependent peroxidase
TIGRFAM ID	[TIGR01412] Tat-translocated enzyme [TIGR01413] Dyp-type peroxidase family

Plasmid Coverage information

Num covering plasmid clones	67
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGAGC GTCCGGGCGA GCGGCCCGCC GCATCCGGCC CGGCCCGGGT GTACAGCCGT 
CGGCGGCTAC TCGTCACCTC CGCGGCGGCC GCGCTGTCGG GCGCGGCCGC CGCGGCGGTC 
GGCGTGGGCA TCGCCGATGC CGGGAGCCCG GGGGCGGCCG CCCCGGCCGC GCCCGAGACC 
CGCGAGGAAG ACACGGTCCC GTTCTACGGC CTGCACCAGG CCGGTGTGCA GTCGCCGGCC 
CAGTCGGCCG CGGCGTTCTG CGCGTTCGAT CTGCACGCCG ACGTCGACGC CGCCGCGCTG 
CGGCGGCTGC TGCGCCTGCT CAGCGACGAC ATCGCTCGGA TGAGCGCGGG CCGGGCCGCA 
CTGGCCGACA CCGCGCCCGA ACTGGCCGCA GCGCCGGCCC GGCTGACCGT GACCGTCGGA 
TTCGGGCCGT CGTTGTTCGA CAAGGTCGGG CTGGCCGCGG CCCGTCCGGC CGGCTTTGCC 
GACCTGCCCG CGTTCCCGAC CATCGATCGG CTCGACCCCA CCTACGGCGG CGGGGACCTG 
CTGCTGCAGA TCTGCGCCGA CGACGCCCTG GTGGTGGCGC ACGCCCAACG GATGCTGTTC 
AAGGACACCC GGGCGTTCGC CACCGCCCGC TGGACCCAGC GTGGGTTCCT GCCGCAAGGG 
CCGGCCGGCC AGACCGGGCG GAACCTGATG GGTCAGGTCG ACGGCACGGT CAACCCACGG 
ACCGACGCCG ATTTCGACCG GGTGGTCTGG TCCACCGGGA CCGGCTGGTT CACCGGGGGC 
ACCTTCCTGG TCTTCCGGCG CATCCGGATG GAGCTGGACA CCTGGGACGA GCTGGATCGG 
TCCGCGATGG AGGCGACGAT CGGCCGGCGA CTGTCCACCG GGGCCCCGCT GACCGGGACC 
GCGGAGCACG ACGAGCCGGA CCTGGACGCG GTCGATGCCA CCGGCCTGCA CGCGATCGCC 
GATTTCGCGC ACCTGCGGCT GGCCCGCGGC GACGGCCCGG CGGCCCAGCT GCTGCGCCGC 
CCGTACAGCT ACGACGATTC GCCGGGCGCC GACGGAGCCA GCGACGTCGG GCAGCTGTTC 
TGCGCCTACC AGGCCGACAT CGGCGCCCAG TTCGTGCCGA TGCAACAGCG GCTGGCCGCC 
GGGGACCTGC TCAATCAGTG GATCACCCCG GTCGGGTCGG CAGTGTTCGC CATCCCGCCC 
GGCTGTGCGC CGGGCGGGTT CCTCGCCGAA GGGATGTTCT CGTGA

Protein sequence

MAERPGERPA ASGPARVYSR RRLLVTSAAA ALSGAAAAAV GVGIADAGSP GAAAPAAPET 
REEDTVPFYG LHQAGVQSPA QSAAAFCAFD LHADVDAAAL RRLLRLLSDD IARMSAGRAA 
LADTAPELAA APARLTVTVG FGPSLFDKVG LAAARPAGFA DLPAFPTIDR LDPTYGGGDL 
LLQICADDAL VVAHAQRMLF KDTRAFATAR WTQRGFLPQG PAGQTGRNLM GQVDGTVNPR 
TDADFDRVVW STGTGWFTGG TFLVFRRIRM ELDTWDELDR SAMEATIGRR LSTGAPLTGT 
AEHDEPDLDA VDATGLHAIA DFAHLRLARG DGPAAQLLRR PYSYDDSPGA DGASDVGQLF 
CAYQADIGAQ FVPMQQRLAA GDLLNQWITP VGSAVFAIPP GCAPGGFLAE GMFS