Gene HS_0858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0858
Symbol
ID	4240350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	933476
End bp	935287
Gene Length	1812 bp
Protein Length	603 aa
Translation table	11
GC content	35%
IMG OID	638104413
Product	ATP-dependent Lon protease
Protein accession	YP_719068
Protein GI	113461001
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1067] Predicted ATP-dependent protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000838018
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACAATTG AGCAAAAAAT AAAAAAAAGA GCCGACGAAT GCTTGTCAGA ACAGTTAATT 
TCTTGGCAAA ATTTATTACC CATGTTACAA CTTGATAATG ATTTTTTAGA CGCTTCATTA 
TCTGAGATTG ATTTTTTTAC TTTGCAACCA AGAGCTAAAA GTGCGGTTGA TCTTTTCCTA 
AAAAATCCTC AACGATCATT GCTTGTTTTA AAAGCAGATG ATCAAGCTGA ATATGCAACT 
TTACTACAAG AATATATAGA ACAAAAAATT CCTGTTTCTG AAACAATTAG TGGTGTTCAG 
TATATTATTG AACAGGGAGA CAGTTTTTCT TTTCCACAAA TCAGTCTAGC ACAGGCAGCA 
TCAATGGAAG ACAACTTTGC AGGAAAACAA AAAGTGGCGA GTGCTTTATT TTTCGATCAA 
AGTCAGTTAT TCGGATCAGT TGTAATTCAC CCCAGTTCTC ATGATATTCA ACTTAATTCA 
GGATTAGTAC ATCAAGTAAA TAATGGTGTA TTGATTTTGA GTGCCGGTGC ATTGTTGGAG 
CAATTTGAGA TATGGCATCG TTTAAAACAC TTATTACTAA CAGGTATTTT CAGTTGGTAT 
TCTCTTAATC CTTTGAAAAC ATTACCTTGC ACAATTCCTA ATTATCCCCT AAATCTAAAA 
GTTATCATTT TAGGTAATCG TTCAGAGTTG GCAACCCTAG GTGAATTGGA GGAGGAACTG 
TATCATTTCG CAGATTATGC AGAAATTGAA AGTTATTTTT CGCTTAATGA TGCACAATCT 
CATCAAAAGT GGGCAAGTTA TGTTCATACG TTGGCAAAAA AACAAGGAAT TGAGCTGAGT 
ATTGAAGGAA TAAATGCACT TTATCAACTT TTTGTGAGAG AAAGTGAAGA TCGTTACTTA 
ATTAGTATCT CACCATTAAA ATTAAAAGGG ATCTTATTTG AAACACAAAT TTTAAGTCAA 
AGAAAACATT TAAGTGCGGT AGATTTTCAA TTATTTTTTC AACAAAAAGA ACAACAGTAC 
TGTTTCTTAC GTGAGCAGGC GTATAAAGGC ATTTTACAGG AGCAAATTTT TATTGCTACA 
GATGGGGAAA TAATAGGACA AATTAACGGA TTATCAGTCA TTGAATATCC CGGTACACCG 
GTTTCTTTTG GCGAGCCTTC AAGAATAAGT TGCATTGTTC AATTTGGTGA TGGTGAAGTA 
ATTGATATTG AAAGAAAAAG TGATCTGGCA GGGAATATCC ATGGCAAAAG CATTATGATT 
GCAGAAACTT GTCTTGCCGG CATTTTAGAT CTTCCTTCTC AATTGCCTTT TTCAGCCTCA 
ATTGCATTTG AACAATCTTA TGGTGATATT GATGGTGATA GTGCGTCTTT GGCTGTTTTC 
TGCTCGTTAT TAAGTGCGTT GGCTGATTTA CCGTTACCAC AAAATATTGC CGTAACAGGT 
AGTATTGATC AATTTGGTTT AGTGCATGCT GTTGGTGGTG TTAACGATAA AATTGAAGGC 
TTTTTTGAAG TTTGTCAGCG TCGTAGATTA ACGGGAAAGC AAGGTGTAAT TATTCCAAGT 
GCGGTATTAA ATCAACTCAG TTTATCCAGT AAAGTAATCG AAGCTGTTCA ACAAGAAAAA 
TTCTTTATTT GGGCAGTTGA CGATATTTTT CAGACCACTG AAATCCTATT TAAGCGATAT 
TTAGTAAGCG AACAGGATGC TGGATTGGAA AAAAATCTTC CCCTCGTAGA TGTGATTCGA 
CAACGATTAG AAGAGAGATC TGAACAACAG CATAAAGGTC GTTTTTGGAA CTTTTTCTTT 
AATCGCCATT AA

Protein sequence

MTIEQKIKKR ADECLSEQLI SWQNLLPMLQ LDNDFLDASL SEIDFFTLQP RAKSAVDLFL 
KNPQRSLLVL KADDQAEYAT LLQEYIEQKI PVSETISGVQ YIIEQGDSFS FPQISLAQAA 
SMEDNFAGKQ KVASALFFDQ SQLFGSVVIH PSSHDIQLNS GLVHQVNNGV LILSAGALLE 
QFEIWHRLKH LLLTGIFSWY SLNPLKTLPC TIPNYPLNLK VIILGNRSEL ATLGELEEEL 
YHFADYAEIE SYFSLNDAQS HQKWASYVHT LAKKQGIELS IEGINALYQL FVRESEDRYL 
ISISPLKLKG ILFETQILSQ RKHLSAVDFQ LFFQQKEQQY CFLREQAYKG ILQEQIFIAT 
DGEIIGQING LSVIEYPGTP VSFGEPSRIS CIVQFGDGEV IDIERKSDLA GNIHGKSIMI 
AETCLAGILD LPSQLPFSAS IAFEQSYGDI DGDSASLAVF CSLLSALADL PLPQNIAVTG 
SIDQFGLVHA VGGVNDKIEG FFEVCQRRRL TGKQGVIIPS AVLNQLSLSS KVIEAVQQEK 
FFIWAVDDIF QTTEILFKRY LVSEQDAGLE KNLPLVDVIR QRLEERSEQQ HKGRFWNFFF 
NRH