Gene Hoch_6606 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_6606
Symbol
ID	8549023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	9060728
End bp	9061909
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	70%
IMG OID	646391266
Product	HtrA2 peptidase
Protein accession	YP_003270965
Protein GI	262199756
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.211294
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.127864
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTCAT CGCCGCTGCC GTCGCCGTCC CGCGTTTGCC CTCTGCCCGC CGCGTCCGCG 
CCGTCCCCGC ACACCGCCCG GCGGACGCGC GCACGCGCCC CGCTGCTGAG CCTGGCCCTG 
AGCCTGGGCC TGGCGCTGAC CCTGGCGTCG GCCGCGCCCG GCGATGCCCG GGCGCAGCTC 
CTGCGCGGCG ACGACACCAC CATCTCCGAC GTCACCGAAA AGGCGCTGCC CAGCGTGGTC 
AATATCTCGA CCACCACCTC GCAGTCCGCG CGCGGGCCCT CGTTCTTCGA TCCCTTCTTC 
AACGACGAAA ACTCACCCTT TCGCGGCCGC CCCGGCAAAC GCTACGGCCA GAGCCTGGGC 
TCGGGCGTCA TCATCTCGGC CGACGGCTAC GTCATCACCA ACAGCCACGT GGTCGAAGAC 
GCCAAAGACA TCCGCGTCTC ACTCTCAGAC GGCCGCGAGC TGAGCGCCAA GATCGTGGGC 
AGCGACCCCA AGAGCGACCT GGCCGTGCTC AAGCTCGAGG GCGCGAGCGG GCTGCAGCCC 
ATCCGCATCG GCCGCTCGAG CAACATCCGC CTGGGCGAGA TCGTGCTCGC CATCGGCAAC 
CCCTTCGGCG TCGGCCAGAC CGTGACCATG GGCATCGTCT CGGCCAAGGG CCGCTCGGGC 
ATGGGCATCG TCGACTACGA GGACTTCATC CAGACCGACG CCGCCATCAA CCCGGGCAAC 
TCGGGCGGCG CGCTGATCAA CCTGCGCGGC GAGCTGATCG GTATCAACAC CGCGATCCTG 
TCGCGCACCG GCGGCTACCA GGGCATCGGC TTCGCCATCC CCACGGACAT GGTCGCGCCC 
ATCAAAGACA GCCTCATCCG CGACGGCGCC GTGGCCCGCG GCTTCCTCGG CGTCAACATC 
CAGACCCTGA CCAGCGAGCA GGCGCGCGCC GCCGGCGTCC CCGACCTGCG CGGCGTCTTG 
ATCACGCGCG TGGTCGAACG CAGTCCGGCC GCCCGCGCCG GCCTGCGCCG CGGCGACATC 
ATCACCCGCG TCGGCGACCG CATCACGCTC ACGGCCGCGC ACGTGGTCAA CTCCGTGGGC 
ATGAGCCGTC CCGACAAACG CCTGGCCCTG ACCATCATGC GCGACGGCAA GACGCGGCGC 
GTCGCAGTAA AACTTGGCGA TTTATCGCAG GTGCCGGAAT AA

Protein sequence

MNSSPLPSPS RVCPLPAASA PSPHTARRTR ARAPLLSLAL SLGLALTLAS AAPGDARAQL 
LRGDDTTISD VTEKALPSVV NISTTTSQSA RGPSFFDPFF NDENSPFRGR PGKRYGQSLG 
SGVIISADGY VITNSHVVED AKDIRVSLSD GRELSAKIVG SDPKSDLAVL KLEGASGLQP 
IRIGRSSNIR LGEIVLAIGN PFGVGQTVTM GIVSAKGRSG MGIVDYEDFI QTDAAINPGN 
SGGALINLRG ELIGINTAIL SRTGGYQGIG FAIPTDMVAP IKDSLIRDGA VARGFLGVNI 
QTLTSEQARA AGVPDLRGVL ITRVVERSPA ARAGLRRGDI ITRVGDRITL TAAHVVNSVG 
MSRPDKRLAL TIMRDGKTRR VAVKLGDLSQ VPE