Gene Hoch_5078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5078
Symbol
ID	8547489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	6999905
End bp	7001173
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	72%
IMG OID	646389754
Product	hypothetical protein
Protein accession	YP_003269459
Protein GI	262198250
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.830154
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAA CCATATTCAT TTCCCAGCTC GTCGCCCTCG CACTCCCACT CGGACTCGGA 
CTCGGCGCGG GCGGCTGCAC ACTCGACGAG GACGAGCCCC CGGCCACCGG CGAAGCCCCT 
CTGGACAACA ACCAGCCCTT CGCCAACGAG CTCGGCGCGG CGGCCACCTT CAGCACCGCG 
GGCGAGGTCG ACCTCGGCGA CGCCTTCGCG CGCAGCTTTG GCGAGAATCA GCGCTCGTGC 
GCGAGCTGCC ACGACCCGGC CGCGGGCTGG TCGCTGTCGC TCGAGCTCAT CCGCGAGCGC 
TTCGACAGCA GCGACGGCAC CGCGCCCCTG TTTCGCCTGA TCGACGGCGC CAACGCGCCC 
ACCGCCGCGG TCGCCAGCAT CGACGAGCGC CGCGAAGCCT ACAGTATGCT GCTGAGCCGC 
GGCGTCATCC GCATCGGCCT GCCCATCCCC GAGGACGCCG AGTTCGAGCT GGTCGCGGCC 
GACGACCCCT ACGGCTACGC CTCGGCGAGC GAGCTGTCGC TGTTCCGCCG ACCGCTGCCG 
GCCACCAACC TGGCCTTCGT CCCCGCGGTG ATGTGGGACG GGCGCGTGCG CGGCGGCGCC 
ACGCTCGAGG ATGACCTGGC CGCGCAGGCC GACGACGCCA CCATGGGCCA CGCCGAGGCC 
ATCACGCCGC TGCCGGCGCG CGTGCGCAGC GCCATCGTCG ACTTCGAGAG CCGGCTGTTC 
AGCGCCCAGA CCGAGACCAC CAGCGCCGGC GCTCTCGACG CCGCGGGCGG GCGCGGCGGC 
CCCGAGCCGC TGGCCGAGCA GAGCGCGGTC TCGGGCCGCT TCGACATCTT CGACGCCTGG 
AGCGAAGAAC CCGAGGACTC GCCGCGCGCG GCCGTGGTGC GCGGGCAGGC GATCTTCAAC 
CTGCAGTGCG GCGGCTGCCA CAACCTGCAA AACGTCGGCA CCAGCCTGGC GCCGCTGTTC 
TTCGATATCT GGGTGTCCGC GCCCGAGCGC CGCACGCCCG ACATGCCGCT CTACACCCTG 
CGCAACCTGC AGACCGGCGA GCTGCGCCAG ACCACCGACC CGGGCCGGGC CCTGGTCACC 
GGCGCCTGGG CCGACGTCGG CCGCTTCAAG ACCCCGACCC TGCGCGCCCT CGCCGCCCGC 
GCACCGTACT TCCACAACGG CGCAGCCGCC ACCCTCGACG AGGTCCTCGA ACACTACGAG 
GACGCGCTCG ATTTCGTGTT CAGCGAGCAG GAGCGCCGCG ATCTGCTGCG CTTCCTCGAA 
GCCCTGTAG

Protein sequence

MKKTIFISQL VALALPLGLG LGAGGCTLDE DEPPATGEAP LDNNQPFANE LGAAATFSTA 
GEVDLGDAFA RSFGENQRSC ASCHDPAAGW SLSLELIRER FDSSDGTAPL FRLIDGANAP 
TAAVASIDER REAYSMLLSR GVIRIGLPIP EDAEFELVAA DDPYGYASAS ELSLFRRPLP 
ATNLAFVPAV MWDGRVRGGA TLEDDLAAQA DDATMGHAEA ITPLPARVRS AIVDFESRLF 
SAQTETTSAG ALDAAGGRGG PEPLAEQSAV SGRFDIFDAW SEEPEDSPRA AVVRGQAIFN 
LQCGGCHNLQ NVGTSLAPLF FDIWVSAPER RTPDMPLYTL RNLQTGELRQ TTDPGRALVT 
GAWADVGRFK TPTLRALAAR APYFHNGAAA TLDEVLEHYE DALDFVFSEQ ERRDLLRFLE 
AL