Gene Hore_06140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_06140
Symbol
ID	7314519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	668058
End bp	669128
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	39%
IMG OID	643611044
Product	peptidase M24
Protein accession	YP_002508366
Protein GI	220931458
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAGA GAATACAGCA ATTAAGAAAA GCTATGAAAA AAATGGATCT GGACAGTTTG 
ATTATTGATT CCAGCCATAA CCGATTTTAT TTAACCGGTT TTACTGGCAC AGCCGGGAGG 
GTATTATTCA CACCAGAAAA TAATTATTTT ATAACAGATT TTCGTTATAC AGAACAGGCC 
CATGAGCAGA TATCGGGTTT TGAAATACTG GAGGTTAACC AGAAAGCAGT TGTGGAAATT 
TCTGATATTC TTGATCAGGA TAATTCTAGC CGGGTCGGTT TTGAAGCAAG AAGTGTTACC 
TATGATGTTT TTCAAAAATA CAAAAAGACA TTTAATGAAA GTATCAAGCT TGTACCAACG 
GCCGGGCTTG TTGAGAAAAT CAGGGTTGTT AAAGATAGAA GTGAAGTTGA GACTATTAAA 
AAGGCAGCTG AGATAGCCGA TAGTGCTTTT AAACACATCC TTGATTTTAT AAAACCGGGG 
GTAACAGAAA GGGAGGTTGC CCTGGAATTA GAATACTTTA TGAAAAAAAA CGGTGGAGAA 
GGAAATGCCT TTGATTTCAT AGTTGCTTCT GGTAAAAGGT CTTCTTTGCC CCATGGGGTA 
GCCAGTGATA AGGTTATTGA AGATGGGGAT TTTGTTACCA TGGATTTTGG AACCTATTAT 
AAGGGTTATT GTTCTGATAT GACACGGACA GTGATAGTGG GAGAACCGAC CCCTGAACAA 
AAGGAGATTT ATAATATTGT GCTAAAAGCT CAGAATGAGG TCATAAAAAA TATCAGAGCA 
GGTATGACCT GTAAAGAGGC AGATGCTATT GCCCGTGATA TAATAGCTGA ACATGGGTAT 
AAGGATAATT TTGGTCACAG CCTCGGTCAT GGCCTCGGAG TTGAAGTTCA TGAGGATCCC 
CGTGTTTCTT ATGCTTCAGA TGAGGTATTA AAACCGGGGA TGGTAGTTAC TGATGAACCC 
GGTATTTATA TTGCTGACTG GGGTGGAGTC AGGATAGAAG ATGACCTGTT GATAACTGAA 
GATGGATGTG AAGTTCTGAC CAGTTCCCCT AAAGATCTTA TTTCGGTGTA G

Protein sequence

MEKRIQQLRK AMKKMDLDSL IIDSSHNRFY LTGFTGTAGR VLFTPENNYF ITDFRYTEQA 
HEQISGFEIL EVNQKAVVEI SDILDQDNSS RVGFEARSVT YDVFQKYKKT FNESIKLVPT 
AGLVEKIRVV KDRSEVETIK KAAEIADSAF KHILDFIKPG VTEREVALEL EYFMKKNGGE 
GNAFDFIVAS GKRSSLPHGV ASDKVIEDGD FVTMDFGTYY KGYCSDMTRT VIVGEPTPEQ 
KEIYNIVLKA QNEVIKNIRA GMTCKEADAI ARDIIAEHGY KDNFGHSLGH GLGVEVHEDP 
RVSYASDEVL KPGMVVTDEP GIYIADWGGV RIEDDLLITE DGCEVLTSSP KDLISV