Gene Hoch_5043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5043
Symbol
ID	8547454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	6958920
End bp	6960242
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	71%
IMG OID	646389719
Product	Di-heme cytochrome c peroxidase
Protein accession	YP_003269424
Protein GI	262198215
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.772632
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.822477
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGT CCGCGCGCAA TCGCCCGCTT GCCATCGCCG CCGCCGCGCT CGTCGCCGCG 
CTCGTCGCCG CGCTCGCCGG CGCGTGTGAG GCGCCCGACC AGGCATTGAG CCCGGGCGAC 
GAGTTCTCGG CCACCGAGAA GCGCCTGATC ATCGGCGCGC TCGGCATCCT GCCCGAGCGA 
CCGCCGCCGT CGCCGTCCAA CGCCTACGCC GACGATCCGC GCGCGGTCGC GCTGGGCCAG 
AAGCTGTTTT TCGACCTCCG GGTCGGCGGC GACGGCGAGA CCGGCTGCGT CACCTGTCAC 
GACCCCGAGA CCGGCTTCCA GGACGCGCGC GACCGCAAGT CCAAGGGCGC CGGCGGCTTC 
AGCCGACGCC ACGCGCTCAC GGTGCTCAAC GCCGCCTACG GCGACGGCTC GTACGAGGCC 
ACGCCCTGGC AGTTCTGGGA TGGGAAAGCC GACAGCCTGT GGTCGCAGGC GCTGGGCCCG 
CCCGAGGACG CCATCGAGAT GAACAGCAGC CGCACGCGCG TGGCGCTGCT GGTCTACGAC 
GAGTACGCGG CCGAGTACCA GGACATCTTT GGCCCCTTCC CCGTGGCCCT GCGCGACGCT 
GCCGGCGACC CCGTCGCGCC GCTGGACGCG CGTCCGGGAA CCCCCTCGTG GCAGGCGCTG 
GCGCCGGCGA CGCAAGACGC CATCACCGAG GTCTTTGTCG GCTTCGGCAA GGTCGTGGCC 
GCGTACGAGC GCCGCATCGT GAGCACCGGC TCGCGCTTCG ACGAGTACTA CCGCGAGCTG 
CTCCTGGGCG ACTTCGACAG CGACATCCTC GACGCTCAGG AGCGCCGCGG CTTGCGCCTG 
TTCGTGGGCA AGGCGCAGTG CCTGCTGTGC CACAGCGGCC CAAACTTCAC CACCACGGAC 
TTCTGGAACA TCGCCGTCGA GGACGAGGAC GCGGACGTCG AGGATTTCGG ACGCGCCACC 
GGCCTCGATT TCGTCCGACA GTCCGAGTTC AACTGCGCCA GCCGCTGGAG CGACATCGAC 
GACCCATCGC GCTGCGCGGT CGCGCAGCTC GAGCAGCGCG AGCGCTTCAT GGGCGCGTTC 
AAGACCCCGG GGCTGCGCGA CGTCTCGAAG ACCGCGCCGT ACATGCACTC GGGCGGGCTG 
GCGACCCTCG AGGAGGTCAT CGAGCACTAC AACGACGGCG GCGCGCTCGC GGGCTACGCC 
GGCGTCTCGG CCATCCGCGA GCTGAACCTG AGCGACGACG AAAAAGCGGC CCTGGTCGCG 
TTCATGAAGA CGCTCGACGG CCAGCCCCTC GATCCCGCGC TGCTCAGCGC GCCGGCCGAG 
TGA

Protein sequence

MTKSARNRPL AIAAAALVAA LVAALAGACE APDQALSPGD EFSATEKRLI IGALGILPER 
PPPSPSNAYA DDPRAVALGQ KLFFDLRVGG DGETGCVTCH DPETGFQDAR DRKSKGAGGF 
SRRHALTVLN AAYGDGSYEA TPWQFWDGKA DSLWSQALGP PEDAIEMNSS RTRVALLVYD 
EYAAEYQDIF GPFPVALRDA AGDPVAPLDA RPGTPSWQAL APATQDAITE VFVGFGKVVA 
AYERRIVSTG SRFDEYYREL LLGDFDSDIL DAQERRGLRL FVGKAQCLLC HSGPNFTTTD 
FWNIAVEDED ADVEDFGRAT GLDFVRQSEF NCASRWSDID DPSRCAVAQL EQRERFMGAF 
KTPGLRDVSK TAPYMHSGGL ATLEEVIEHY NDGGALAGYA GVSAIRELNL SDDEKAALVA 
FMKTLDGQPL DPALLSAPAE