Gene Hore_14920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_14920
Symbol
ID	7313083
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	1589869
End bp	1591545
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	46%
IMG OID	643611933
Product	Sporulation protease LonB
Protein accession	YP_002509236
Protein GI	220932328
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1067] Predicted ATP-dependent protease
TIGRFAM ID	[TIGR00764] lon-related putative ATP-dependent protease [TIGR02902] ATP-dependent protease LonB

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	0.989264
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGATCAAA ATCTCTTAAA TGTTTTTACG ATTATTCAGT TTTTCTTTGC GGTGGTTATC 
GGTCTCTACT TCTGGAATAT GCTTCGTAAC CAGCAGGGTA CTAAACGTGC TGTGGTTAAG 
GAATCAAGAA AGGAATTAAA TAAATTGAGG GAGATGAGAA GGATATCCCT CACTGAACCC 
CTGGCCGAAA AAACAAGGCC AACCGGGTTT GAGGACATAA TAGGACAAAA AGAGGGGATT 
GAGGCCCTGA AAGCAGCACT GTGTGGGCCC AATCCCCAGC ATGTTATATT ATATGGACCG 
CCAGGTGTCG GTAAAACCGC AGCAGCCAGG CTGGTCCTGG AAACGGCCAA ACGAAATCCC 
CTGTCACCCT TCAAACGTGA TGCTAAATTT ATTGAAATAG ACGGGACTAC GGCCCGTTTT 
GATGAAAGAA GTATTGCCGA TCCCCTGATA GGTTCGGTCC ATGACCCGAT TTATCAGGGA 
GCGGGTCCCA TGGGGATGGC CGGTATACCC CAGCCGAAAC CGGGGGCAGT TACCAAGGCC 
CACGGAGGAG TTCTTTTTAT AGATGAAATC GGGGAACTAC ATCCCATTCA GATGAACAAG 
CTTTTAAAGG TACTTGAAGA TAGAAAGGTT TTTCTTGATA GTGCCTATTA TAGTGAAGAG 
GATACCAATA TACCTCAGTA TATCCATGAT ATCTTTCAAA ACGGTCTTCC GGCTGATTTC 
AGGTTGATTG GTGCGACAAC AAGACAGCCT GATGAAATTC CGCCGGCTAT CAGGTCCAGG 
TGTCTTGAGA TCTTCTTCAG GGAACTGAGT ACAGACGAAA TAAGGAAGAT TGCAGTGCGG 
GCTGTTAAAA AGATCAGGTT TAAAATTGAG GATAAGGCCC TTGACCTTAT TGAGAAATAT 
GCCAAGAACG GGCGGGAAAC GGTCAATATG GTTCAGCTGG CCGGTGGTAT TGCTATTGCC 
GGGCACCGTC AGGAAATAAA GGCTCATGAT ATTGAAAAGG TTTTAAATAA CGGCCAGTAT 
TCTCCCCGAC TTATTAAAAA GATTCATGGC TTTCCCCAGA TAGGCGTTGT AAACGGCCTG 
GCCGTAAGGG GTCCCAATAT CGGGATGTTA CTGGAGATTG AGGTTGCCGC CATAAAAAAA 
AGGTCTTCTC CGGGTCAGAT TAAGATAACA GGTGTTATTG AGGAAGAGGA GATAGGGTCA 
ATGGGGCATA CGGTCCGCCG GAAAAGTATG GCCCGGGAGT CTGCCGAAAA TGCCCTGACC 
GTGTTACGCC GGATGATGCC GGTTGATCCC CATAATTATG ATATCCATGT TAATTTCCCG 
GGAGGGATTC CGGTCGATGG CCCTTCAGCC GGGGTTGCCA TGTCGGTGGC CATTTATTCA 
GCTATAACCA AAAAACCAGT TGATAACCAT ATTGCCATGA CCGGTGAGGT TTCAATCAGG 
GGTCTTGTTA AACCAGTTGG TGGAATCGCT GCCAAAATTG AGGCTGCCAG CAAAGCTGGA 
GCCAGAAAAG TGTTAATACC CAGGGAAAAC TGGCAGAACC TCTTTGAACT CAGGGATGAT 
ATTGAAATTA TTCCGATAGA GACCCTGGAA GAGGCTATTG AGAAATCGGT GGCTATAAAA 
GAAGATGAGA AAATAAAATT AATTAAAGCA GATAGTTTAA TGACTGTTCC CCAATAA

Protein sequence

MDQNLLNVFT IIQFFFAVVI GLYFWNMLRN QQGTKRAVVK ESRKELNKLR EMRRISLTEP 
LAEKTRPTGF EDIIGQKEGI EALKAALCGP NPQHVILYGP PGVGKTAAAR LVLETAKRNP 
LSPFKRDAKF IEIDGTTARF DERSIADPLI GSVHDPIYQG AGPMGMAGIP QPKPGAVTKA 
HGGVLFIDEI GELHPIQMNK LLKVLEDRKV FLDSAYYSEE DTNIPQYIHD IFQNGLPADF 
RLIGATTRQP DEIPPAIRSR CLEIFFRELS TDEIRKIAVR AVKKIRFKIE DKALDLIEKY 
AKNGRETVNM VQLAGGIAIA GHRQEIKAHD IEKVLNNGQY SPRLIKKIHG FPQIGVVNGL 
AVRGPNIGML LEIEVAAIKK RSSPGQIKIT GVIEEEEIGS MGHTVRRKSM ARESAENALT 
VLRRMMPVDP HNYDIHVNFP GGIPVDGPSA GVAMSVAIYS AITKKPVDNH IAMTGEVSIR 
GLVKPVGGIA AKIEAASKAG ARKVLIPREN WQNLFELRDD IEIIPIETLE EAIEKSVAIK 
EDEKIKLIKA DSLMTVPQ