Gene Noca_0050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_0050
Symbol
ID	4600101
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	56595
End bp	58040
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	69%
IMG OID	639774664
Product	Dyp-type peroxidase family protein
Protein accession	YP_921286
Protein GI	119714321
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2837] Predicted iron-dependent peroxidase
TIGRFAM ID	[TIGR01413] Dyp-type peroxidase family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAGC AGCACCACAA CCCCACCGAA CTCACCGCCA GCACCCCTGG TGCGGCCAGA 
CATGCCCGCG GGGTCGTCCC CTTCCAGCCG GACGACCCCG TCATGAAGTC GCCCTACGCC 
CACGGCGCAT TCGTCTTCGC GACCCTTCCC GCCGAGTGGG ACACCCCCGC CGTGACCACC 
TGGCTCACCA CCATCGACAC CGCCCGACAG GCCCTGCGTG CTGCGTGCAC TCCTGACGTG 
GTTCGCGTCG CGACGATCGC CGTGGGGTTC GGGCCTTCGT TCTTCTATCG GCCCGACGCC 
ACTGTGCGCT TCGCCGGGGT GACTCCGCCG GCGGGATTCG CTCAGCTGCC TCCGATGCCG 
CACGGCGCGG CGGTGCCGGC CGACGTGTGC TTCTACATCG TGGCGATCGC CGAGGCAGAG 
ATCGCCAAGT TCGTCAACGC GCTCGCGGCC AGCGGCGTCA CCGGCCTGGC GATGGAGCAC 
GGCTACAAGT CCTATCCGGA CGAGGAGGCG TTCGGGTACC GAGACGGGGT CCGCAACATC 
CCCGTGTCCT CGCGCAACGA TTTCGTGTTC ATTGACGCCG ACCGCAACGC CGAGGAGCCG 
GACTGGACCC ACCACGGCAC CTACATGGCC TACATGCGCA TCGCCCAGAA CCTGGCCGCG 
TTCCAGGCGA TCCCGGCCGC CGAGCAGGAC CAGGTCATCG GCCGGGACCG GACGGGCCGC 
CGCCTCGACC TCCCCGAGGG CACCAAAGCA AAGGACGAGC CGTCCTTCGC TACCGACGAC 
CCGCGCCTGG ACTCCCACGT CCGCAAGGTC GGTCCGCGCG GGTTCGAGCA CCGCGACGAG 
ACCCAGATCT TCCGTCGCGG CCTGCCGTTC TTCGAGGTGC GCGACGGCCA GGTCGTCCAG 
GGGCTGCAGT TCGCCTCCTT CCAGGCCTCG CTCGACCAGT TCGACGCGGT GTTCAACCGG 
TGGATGCTCA ACCCCGACTT CCCGCGGTCC GGGACAGGGG TCGACGCACT CGTGGCGCGC 
GGCCTGATCA CGATCGAGAA GTGGGGTTTC TACTTCGTGC CTCCCGACAC CGACGGCCCC 
ATCGGGATGG GCATGTTCGC GCCCGCCAAG GAGACGCGGA AGCCGAAGAC GGGCAGAGTG 
GCGGTCCGCA AAGAGCTGGT CGACGCGAAC GGGACACGCG TCAACGGCGA CCTGGGCGGC 
TTCACCTTCC AGATCACCGA CCTGGAGGGC AACCCGGTCG GAGAGTCGTT CACTTCAAAC 
TCGCATGGCC ACGCGCTGTC GGGCGAGATC CCGCTCGGCG ACTACCAGCT GACCGAGCTG 
CCCCCTCAGC CCCCGCAGCC GCCGATGCCA GCGGCCGGGC CGGTGTCGTT CACTCTCCGC 
TCCGCCCAGG AGGTCGTGAA GGTCCGCAAC CAGCTCACCC CCGCCGCCGG ACCGTACAAC 
GGCTGA

Protein sequence

MTEQHHNPTE LTASTPGAAR HARGVVPFQP DDPVMKSPYA HGAFVFATLP AEWDTPAVTT 
WLTTIDTARQ ALRAACTPDV VRVATIAVGF GPSFFYRPDA TVRFAGVTPP AGFAQLPPMP 
HGAAVPADVC FYIVAIAEAE IAKFVNALAA SGVTGLAMEH GYKSYPDEEA FGYRDGVRNI 
PVSSRNDFVF IDADRNAEEP DWTHHGTYMA YMRIAQNLAA FQAIPAAEQD QVIGRDRTGR 
RLDLPEGTKA KDEPSFATDD PRLDSHVRKV GPRGFEHRDE TQIFRRGLPF FEVRDGQVVQ 
GLQFASFQAS LDQFDAVFNR WMLNPDFPRS GTGVDALVAR GLITIEKWGF YFVPPDTDGP 
IGMGMFAPAK ETRKPKTGRV AVRKELVDAN GTRVNGDLGG FTFQITDLEG NPVGESFTSN 
SHGHALSGEI PLGDYQLTEL PPQPPQPPMP AAGPVSFTLR SAQEVVKVRN QLTPAAGPYN 
G