Gene Hoch_4986 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4986
Symbol
ID	8547394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	6872924
End bp	6874192
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	62%
IMG OID	646389660
Product	ATP-dependent Clp protease, ATP-binding subunit ClpX
Protein accession	YP_003269368
Protein GI	262198159
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.244142
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.534035
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAGCG AAAAGCGAGA CAGTGGCCAA GCCAACCTCA CCTGCTCCTT CTGCGGTAAG 
TCGCAGAAGG AAGTGAAGAA ACTCATCGCC GGCCCCACTG TCTACATCTG TGACGAGTGC 
ATCGGGCTGT GCAATGACAT CATCGCCGAG GAGATCGAGA AGGAAGATCA GGCCTACGGA 
ACGGCCACGA TCCCCAAGCC CCAGCACATC AAGAAGATCC TCGACGAGTA CGTGATCGGT 
CAGGAGCGCG CCAAGAAGAT CTTGGCGGTG GCGGTGCACA ACCACTACAA GCGCATCGAT 
CACAAGGCCG GCGACGACGA GGAAGAGGTC GAGCTGCAGA AGTCGAACAT CCTGCTGCTC 
GGCCCCACCG GCTCGGGCAA GACCTTGCTG GCGCAGACCC TGGCGCGCAT CCTCAATGTG 
CCCTTCGCCA TCGCCGACGC CACCAACCTC ACCGAGGCCG GCTACGTCGG CGAGGACGTC 
GAGAACATCA TCGTGAGCCT GCTGCAGAAC GCCGATCACG ACATCGAGCG GGCGCAGCGC 
GGCATCGTGT ACATCGACGA GATCGACAAG ATCGCGCGCA AGAGCGACAA CCCGTCGATC 
ACGCGCGATG TGAGCGGCGA GGGTGTGCAG CAGGCGCTGC TCAAGATCAT CGAGGGCACG 
CTGGCCGCGG TGCCGCCCAA GGGCGGTCGC AAGCACCCGC AGCAGGAGTT TCTGCAGGTC 
GATACCTCGA ACATCCTGTT CATCTGCGGC GGCGCGTTCA CGGGTCTCGA GGAGATCATC 
GAGAACCGCA TCGGCCAGCG CATGATCGGC TTCGGCGCCA CGATGAAGCC CAAGAAGGCG 
CTCGACCGCT GGGAGCTGAT CAAAGAGGTG CAGCCCGAGG ATCTGCTCAA GTACGGCATG 
ATCCCCGAGT TCGTCGGCCG CCTGCCGATG ATCGCGCCGC TGCACGAGCT GTCTGAGGAC 
GCCCTGGTGC AGATCCTTAC CCAGCCCAAG AACGCGCTGA TCAAGCAGTA TCAGAAGCTG 
TTCGAGATGG ACGGGGTGAA GCTCAAGTTC ACCCACGGCG CGCTGTACAA GATCGCGTCG 
CTGGCCCAGG CGCAGAAGAG CGGCGCCCGC GGTCTGCGCG CCATCCTCGA GTCGGCGTTG 
CTCGACATCA TGTACGACAC CCCCAGCCAG CACAACATCA GCGAAGTGAT CATCAACGAG 
GACGTGGTCG AGAAGCACTC CGAGCCGATG GTTACCTACG TCAAAGAGCC GGCCGTAGAG 
TCGGCCTAA

Protein sequence

MPSEKRDSGQ ANLTCSFCGK SQKEVKKLIA GPTVYICDEC IGLCNDIIAE EIEKEDQAYG 
TATIPKPQHI KKILDEYVIG QERAKKILAV AVHNHYKRID HKAGDDEEEV ELQKSNILLL 
GPTGSGKTLL AQTLARILNV PFAIADATNL TEAGYVGEDV ENIIVSLLQN ADHDIERAQR 
GIVYIDEIDK IARKSDNPSI TRDVSGEGVQ QALLKIIEGT LAAVPPKGGR KHPQQEFLQV 
DTSNILFICG GAFTGLEEII ENRIGQRMIG FGATMKPKKA LDRWELIKEV QPEDLLKYGM 
IPEFVGRLPM IAPLHELSED ALVQILTQPK NALIKQYQKL FEMDGVKLKF THGALYKIAS 
LAQAQKSGAR GLRAILESAL LDIMYDTPSQ HNISEVIINE DVVEKHSEPM VTYVKEPAVE 
SA