Gene Hoch_2673 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2673
Symbol
ID	8545060
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	3683925
End bp	3685064
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	72%
IMG OID	646387368
Product	peptidase S1 and S6 chymotrypsin/Hap
Protein accession	YP_003267097
Protein GI	262195888
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.314842
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTACTGGC GCAGCGAATC GCAATCCCCC TCCCGTCGGC GCCGCGCCCT GCCCTCTGGC 
TGGCTCGCTC CGGCTGTCGC GCTGTGCGCC GCCGCCCTCA TCGCCTGCGG CGGCGCCGGC 
GAGCAGCAGG GCGCCAGCGA GGCGGTCCAG GCCGCGCAAG AGCCGCTCAG ACCGGCCGAG 
ATCGCCCAGC GCAGCAAGCC GGCCATCGTC CGCGTCGAGG TCCGCTCACC GCGCGGCGAA 
GGCGTGGGCA CGGGCTTCAT CCTCGACGCC AGCGGCCGCA TCGCCACCAA CCTGCACGTC 
ATCGGCGGTG CCACCGAGAT CGAGGTCGTG CTGCTCGACG GCACCCGTCT GCCGGTGAGC 
ACCATCGCGG GCACCGACCC CGAGCGCGAT CTGGCCGTGA TCGAGGTCGA CAGCGAGCGC 
GCGCTGCCGA CCCTGCCCCT GGGCAACAGC GATCAGGTGC TGGTCGGCGA CCCGGTGGTC 
GCCATCGGCA ACCCGCTGGG CGTCCTCGAC TACACCGTGA GCGACGGTCT CATCAGCTCC 
GTGCGCGAGA TCAACCCCGA GCTCAAGGTG CTGCAGATCT CGGCGCCCAT CTCGCAGGGC 
TCGAGTGGCG GACCGCTGTT CAACCAGCTC GGCGAGGTCA TCGGCGTGGC CACCTTCATC 
GCCGGCGCGG GCCAGAACCT CAATTTCGGC ATCCCCAGCA ACTACCTGCG CCCGCTGCTC 
GAGCGCGACG ACCAGCTCAC CCCGCAGGCC CTGTCAGAGG CCCTGGCCGA GAAGTACGCG 
CCGCCGCCCG AGCAGCCGCG CGGGCCGGTG CGCCGCCAGG TCCCGGCTCA TCCCCTGAGC 
GTGCTCGAGG GCTGCGGCGA GGACGCCATG CAGCGCGCTG TGGACGAGAT CTCCGAGGCC 
ATTCAGCTCG GCGCGCCGCT CTACAACCAG GGCAACCACG AGGCCTGCTT CCGCATCTAC 
GAGGGCACGG CCATCCGCCT CGAGCGCGAG CTTGCGTGTC CGGGCCTGCG CGATGCCCTG 
GGCCAGGGCC TGCTGCGCGC CTCGACCTTG AACGACCACA CCGCCAAAGC CTGGGCCATG 
CGCGACGCGT TTGACGGCGT GCTCAGCGTG GTCGCCCGCA AACTCGGCGT CACGCCCTGA

Protein sequence

MYWRSESQSP SRRRRALPSG WLAPAVALCA AALIACGGAG EQQGASEAVQ AAQEPLRPAE 
IAQRSKPAIV RVEVRSPRGE GVGTGFILDA SGRIATNLHV IGGATEIEVV LLDGTRLPVS 
TIAGTDPERD LAVIEVDSER ALPTLPLGNS DQVLVGDPVV AIGNPLGVLD YTVSDGLISS 
VREINPELKV LQISAPISQG SSGGPLFNQL GEVIGVATFI AGAGQNLNFG IPSNYLRPLL 
ERDDQLTPQA LSEALAEKYA PPPEQPRGPV RRQVPAHPLS VLEGCGEDAM QRAVDEISEA 
IQLGAPLYNQ GNHEACFRIY EGTAIRLERE LACPGLRDAL GQGLLRASTL NDHTAKAWAM 
RDAFDGVLSV VARKLGVTP