Gene Hoch_2130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2130
Symbol
ID	8544516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	2953199
End bp	2954305
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	70%
IMG OID	646386837
Product	peptidase S1 and S6 chymotrypsin/Hap
Protein accession	YP_003266568
Protein GI	262195359
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCATGC CTCGTCCTCT TGTCGTATGG ACCGGCCGCG CGCGCTGGTT GGTATCTCTG 
GCCATCTGCG CCGCGCTGCT GAGCGGCGGA CACCTGGCCC ACGCTCAGAG CACCGCGCCC 
GGCGATGACG ATCTCGCCGA CCTGCTGCCC GAGGAGCGCA ACACCGTCCG CCTGTTCGAG 
CGGACCGCGC CCTCGGTGGT CTTCGTGATC AACCGCGGCG TCCAGCGCGA TCTGTTCTCG 
CGCCACACCG GCGAGTATCA GCGCGGCACC GGCTCGGGCT TCGTCTGGGA CAAGAGCGGC 
CACATCGTCA CCAACTACCA CGTCATCCAG GGCGCCTCCT CGGTCGCCGT GGTCATCGAC 
AACGAGGAGT ACCCGGCGCG CGTGCTCGGC GCCGAACCCA AGCGCGACAT CGCCGTGCTG 
GCGCTCGACG GCGCCGCCAA GCGCGCGCTC ACGCCGGTGC GTCTGGGCCA CGACGAGCGC 
CTGCGCGTGG GCCAGCACGT CATCGCCATC GGCAGCCCCT TCGGCCTCGA CCGCACGCTC 
ACCACCGGCG TGATCTCGGC CCTGGGCCGC GACATCGTCG GCATCGGCGG CGTCACCATC 
CCCGACATGA TTCAGACCGA CGCGTCGATC AACCCCGGCA ACTCGGGCGG CCCCCTGCTC 
GACTCGGCCG GTCGCCTGAT CGGCATGAAC ACCATGATCT ACTCCAAGAG CGGCTCCAGC 
GCCGGCATCG GCTTTGCCGT CCCCGTGCGC TTTCTGCGCC GCCTGGTGCC GCAGATCATC 
CGCACCGGCC ACGCCATCAC CCCCGACCTC GGCGCCCGCT ACTTCGATGA CGACGTCGCC 
CGCCGCCTGC GCGTCGAGGG CGTGATCATC CGCGCCGTGC CGCGCGGCTC CAGCGCCGCA 
CGCGCCGGCT TCCGCGGCAC CGCGCGCACG CGCCGGGGCA ATATCCGCCT GGGCGACATC 
ATCGTCGGCG TCGATAGCCA CCGCGTGCGC AACTACGACG ATCTCTACAA CACCTTCGAC 
AACTACAAGC CCGGCGACCG CGTGGTCATC CACATCGTGC GCGACGGTCG CCGACAACAG 
CTCGAGGTCG TCCTCGAAGC GCTGTAG

Protein sequence

MLMPRPLVVW TGRARWLVSL AICAALLSGG HLAHAQSTAP GDDDLADLLP EERNTVRLFE 
RTAPSVVFVI NRGVQRDLFS RHTGEYQRGT GSGFVWDKSG HIVTNYHVIQ GASSVAVVID 
NEEYPARVLG AEPKRDIAVL ALDGAAKRAL TPVRLGHDER LRVGQHVIAI GSPFGLDRTL 
TTGVISALGR DIVGIGGVTI PDMIQTDASI NPGNSGGPLL DSAGRLIGMN TMIYSKSGSS 
AGIGFAVPVR FLRRLVPQII RTGHAITPDL GARYFDDDVA RRLRVEGVII RAVPRGSSAA 
RAGFRGTART RRGNIRLGDI IVGVDSHRVR NYDDLYNTFD NYKPGDRVVI HIVRDGRRQQ 
LEVVLEAL