Gene HS_0489 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0489
Symbol	lon
ID	4239971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	529557
End bp	531968
Gene Length	2412 bp
Protein Length	803 aa
Translation table	11
GC content	37%
IMG OID	638104037
Product	Lon-A peptidase
Protein accession	YP_718700
Protein GI	113460634
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0466] ATP-dependent Lon protease, bacterial type
TIGRFAM ID	[TIGR00763] ATP-dependent protease La

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCAA AACGAACTAA GCTAGAGCAT CTTCCGGTTC TACCATTGCG TGATGTGGTA 
GTTTTTCCTT ATATGGTAAT GCCATTGTTT GTTGGTCGTC CCAAGTCTAT TCGTAGTTTA 
GAGGAGGCGA TGGAAAATAA TAAGCAATTA TTATTGGTTT CACAAAGAAA ACCTGACATT 
GAAGAACCTA AGATCGCTGA TCTTTATAAG ATTGGTACAT TAGTCAATAT TATTCAATTG 
TTAAAATTGC CGGATGGTAC TGTAAAAGTT CTTGTTGAAG GACAACAAAG AACTAAACTT 
ATTGATTTAC AAGATAATGG GGAATTCTTT TTAGCGTCTC ACGAATTAAT TGAAACACAA 
TGGAGTGATG AGAAAGAATT AAGTGTATTG AAGAAAATTA CTTTATCCGA ATTTGAAAAA 
TATGCGAATT TAAATAAAAA AATTCCCGCA GATATTATTT CTGCATTGCG ACGTATTAAT 
GATATAGAGA GATTAAGTGA TACGGTTGCA GCTCATCTTC CGGTATCTAT TAATGAAAAG 
CAAAATATCC TAGAAATAGG AGATTTGTCG GCACGGTTTG AATATTTATT AGGATTAATG 
GTAAGCGAAG CCGATATATT GCAAGTTGAA CAACGTGTGC GTGGCAGAGT TAAAAAACAG 
ATAGAAAAAA ATCAACGTGA TTACTATCTG AATGAACAAA TTAAGGCATT GCAAAAAGAG 
CTGAATGATG ATGAAAACAC AGTTGATGAA GTTGAGCAAT TACGCAAGAA AATAGAAGAG 
GCTAAGATGC CGATAGAGGC TCGTGAAAAA GTGTTTGCCG AATTGCAAAA ATTAAAGATG 
ATGTCGCCAA TGTCTTCCGA AGCAACGGTT TTGCGTAGTT ATATTGACTG GATGGTTCAA 
GTTCCTTGGC ATAAGCGAAC TAAAGTTAAA AAAGATCTTG CCAAAGCACA GGAAACCTTA 
GATGCGGATC ACTATGGCTT AGAACGTGTT AAAGAGCGTA TATTGGAGTA TTTAGCGGTA 
CAAAGTCGCT TAAATCAATT AAAAGGCCCT ATTTTATGTT TAGTTGGCCC TCCGGGTGTG 
GGAAAAACAT CGCTAGGGCA TTCTATTGCC AACGCAACGG GGCGTAAATA TGTACGCATG 
GCATTAGGCG GTGTGCGAGA TGAAGCAGAG ATTCGTGGAC ATCGTAAAAC GTATATAGGT 
TCTTTACCCG GCAAATTAAT TCAAAAAATG GCAAAAGTGG GGGTGAAAAA TCCGCTGTTT 
TTACTTGATG AAATTGACAA AATGGCAATG GATTATCGAG GTGATCCGGC ATCTGCATTA 
TTGGAAGTGC TTGATCCTGA ACAAAATTCA CATTTTAATG ATCATTATCT TGAAGTCGAT 
TATGATTTAT CTGATGTAAT GTTTGTTGCT ACGTCCAACT CAATGAATAT TCCAGCACCT 
TTACTGGATC GTATGGAAGT CATTCGTCTC TCCGGTTATA CGGAAGATGA AAAACTCAAT 
ATTGCGACAC GTCACTTATT GAATAAACAA ATTGAGCGTA ACGGATTGAA GACTGATGAG 
TTGGTTATCA ATGAAGAGGC TATTTTAGAT ATTATTCGCT ATTATACTCG AGAAGCCGGT 
GTTCGTTCTT TAGAGAGAGA GATTTCTAAA ATTTGCCGCA AAGCAGTGAA AAATCTGCTA 
TTAGATAAAA GTTTGAAATC TATTCAAGTG AATTCTAACA ATTTGCAAGA GTATCTTGGG 
GTTAGACGCT TTGAATTTGG TCGAGCAGAT ACACAAAACC GCATTGGTGA AGTGACAGGA 
TTAGCTTGGA CCGAAGTTGG CGGTGATTTA TTAACAATAG AAACGGCATC TGTAATCGGT 
AAAGGTAAAT TGATTTATAC CGGTTCTTTG GGCGATGTGA TGAAAGAAAG TATTCAAGCT 
GCGATGACTG TTGTAAGAAC TCGAGCTGAA AAGTTAGGTA TTGCTAATGA CTTTCATGAA 
AAACGTGATA TTCACATTCA TGTACCGGAC GGTGCGACTC CGAAAGATGG ACCAAGTGCG 
GGTATTGCTA TGTGTACAGC GTTGGTTTCT TGTTTAACCG GTAATCCGGT AAAATCTGAA 
GTGGCAATGA CGGGGGAAAT TAGTTTACGT GGCAAAGTAT TACCGATTGG TGGGTTGAAG 
GAAAAATTAT TAGCAGCTCA TCGAGGTGGT ATTAAAACGG TGATTATACC CAAAGAAAAT 
GTAAAAGATT TGGAAGAAAT CCCTGAAAAT GTGAAAAATA ATTTAACTAT TCATGCGGTT 
GACACTATTG ATGAAGTCTT AACAATTGCA TTAGAAAATC CACCGGAAGG AGTTGATTTT 
GTGAAGCTTT CTCCAATTCA TAAAATTAAA TCTTCTCGTA AGCGTTCTTC TCGAACAAAA 
AGTTTGAATT AA

Protein sequence

MNAKRTKLEH LPVLPLRDVV VFPYMVMPLF VGRPKSIRSL EEAMENNKQL LLVSQRKPDI 
EEPKIADLYK IGTLVNIIQL LKLPDGTVKV LVEGQQRTKL IDLQDNGEFF LASHELIETQ 
WSDEKELSVL KKITLSEFEK YANLNKKIPA DIISALRRIN DIERLSDTVA AHLPVSINEK 
QNILEIGDLS ARFEYLLGLM VSEADILQVE QRVRGRVKKQ IEKNQRDYYL NEQIKALQKE 
LNDDENTVDE VEQLRKKIEE AKMPIEAREK VFAELQKLKM MSPMSSEATV LRSYIDWMVQ 
VPWHKRTKVK KDLAKAQETL DADHYGLERV KERILEYLAV QSRLNQLKGP ILCLVGPPGV 
GKTSLGHSIA NATGRKYVRM ALGGVRDEAE IRGHRKTYIG SLPGKLIQKM AKVGVKNPLF 
LLDEIDKMAM DYRGDPASAL LEVLDPEQNS HFNDHYLEVD YDLSDVMFVA TSNSMNIPAP 
LLDRMEVIRL SGYTEDEKLN IATRHLLNKQ IERNGLKTDE LVINEEAILD IIRYYTREAG 
VRSLEREISK ICRKAVKNLL LDKSLKSIQV NSNNLQEYLG VRRFEFGRAD TQNRIGEVTG 
LAWTEVGGDL LTIETASVIG KGKLIYTGSL GDVMKESIQA AMTVVRTRAE KLGIANDFHE 
KRDIHIHVPD GATPKDGPSA GIAMCTALVS CLTGNPVKSE VAMTGEISLR GKVLPIGGLK 
EKLLAAHRGG IKTVIIPKEN VKDLEEIPEN VKNNLTIHAV DTIDEVLTIA LENPPEGVDF 
VKLSPIHKIK SSRKRSSRTK SLN