Gene Hore_19830 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_19830
Symbol
ID	7312798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2135765
End bp	2137360
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	36%
IMG OID	643612429
Product	leucine-rich repeat protein
Protein accession	YP_002509725
Protein GI	220932817
COG category	[S] Function unknown
COG ID	[COG4886] Leucine-rich repeat (LRR) protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	61
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAA AGCCTTTTTC AAAAATAGTT ACACTGTTTG TTATAATTAT TTTTTCAATC 
TTTCTTTTTG CCTGGAATGG GGAAGCTGTC GAAGATACAG GAATTATTGT TTTTGAAGAT 
GAGGACCTGA AAAAAGTGGT AATGAGGTCA CTGAGCAAGC CGGAAGGACC TGTCTTCAGG 
CCAGAGGTGG AAAATTTAAC TGAGTTCAGT ATCCCCTCTT TTCGTCATTA TGAAATAAAT 
TCTATAAAGG GATTAGAAGC CTTTTTAAAC ATAAAAACCC TGCGGATTGG GCCAAATTAT 
ATCAGTGATT TAACCCCCCT GGCCCATTTA ACAGACCTTG AAAGACTCTA TATCTTTGAA 
AATCATATTG AAGATTTAAG TCCACTGGGA AAATTGAAGG AATTAAGGGA GTTAATAATC 
AGGGGGTTAC CTCCATATAA AAAGGGATTG CCTTCAGGTA AATATTCAGG ACATTATATT 
GAGGACATAA GTCCTCTGGC CGGTTTAGTA AAACTTGAAT ACCTTAAATT ATCCCATCAA 
AAGATATCAA ATTTAGAGAC CCTGACTCAA CTACCAAACT TAAAAACCCT GAATGTAGCC 
TATAACAGTA TATCTGACCT TAAACCCCTG ACTGCTTTGA CAGGGTTAAG CCACCTGGAT 
CTGGAAGCCA ACAATATTAA AGATATATCT CCATTAAGAG GGTTAAAAAA ACTTACCTAT 
TTAAATCTGA TCAGAAATGA GTTGACCGGT GTAAAACACC TTTCCAGTCT GGAAGGTTTG 
CAGGTATTGC TGTTAAGCGG GAATGACCTC CGGAATATTG CCTCCCTTAC CCGACTGGTA 
AACCTTGAGA AACTGGATAT CAGTGACAAT AATATCAGTG TTGCCCCCGG TTTAAAGGAA 
TTTAAAGGTC TGAAGGAATT GAATATAAGT GGCAACCCCA TTGACGATAT TAATTTTATC 
AGCGAGTGCA GGAAACTTGA AAGATTACTG GCCTTCAATT GTGAGATAAG GGACATATCA 
CCTTTAAGGG GACATAACAG TTTAAAAGAG CTTTTTTTGC ATAACAACAG GATTACCGAT 
ATTAGTCCCC TTGAAGGGCT GAACACTCTC GAAAGGCTTG ACCTGAGTGG AAATAGTATA 
GAAAATGTTT CAGTCATATC TGGACTCAAT AAACTTAAAT ATTTAGACCT TGAGGGGTGT 
GGTCTGACCG CGATAGAATT TTTAAAAGAC CTGGGATCCC TGGAATACCT TGAACTTGAA 
AATAATAGAA TAAGCCAGAT TGAGCCTTTA AAAAAACATA TTAATTTAAA AACCCTGGTT 
CTTGATAATA ACCAGATTAA AGATATAAGT ACCCTGGGTG AATTGATGAA CTTAAAGGTG 
CTATCATTAA ACGATAATCA GATTGAAAAC ATCGATTCTT TGACTGGTTT AAACCAGCTG 
GAAGTATTAT ATATTTCGGG CAATAGAATC AGGAATATTA AACCCCTTTT AAAATTAAAT 
AATTTGAGTG TTGTAGCAAT AAAAAATAAT CAGTTTAAGC TTGATGAAGA TGTTATAAAA 
AAGCTGGAGG ATAATAAAGT AACTGTTGTG TATTGA

Protein sequence

MSKKPFSKIV TLFVIIIFSI FLFAWNGEAV EDTGIIVFED EDLKKVVMRS LSKPEGPVFR 
PEVENLTEFS IPSFRHYEIN SIKGLEAFLN IKTLRIGPNY ISDLTPLAHL TDLERLYIFE 
NHIEDLSPLG KLKELRELII RGLPPYKKGL PSGKYSGHYI EDISPLAGLV KLEYLKLSHQ 
KISNLETLTQ LPNLKTLNVA YNSISDLKPL TALTGLSHLD LEANNIKDIS PLRGLKKLTY 
LNLIRNELTG VKHLSSLEGL QVLLLSGNDL RNIASLTRLV NLEKLDISDN NISVAPGLKE 
FKGLKELNIS GNPIDDINFI SECRKLERLL AFNCEIRDIS PLRGHNSLKE LFLHNNRITD 
ISPLEGLNTL ERLDLSGNSI ENVSVISGLN KLKYLDLEGC GLTAIEFLKD LGSLEYLELE 
NNRISQIEPL KKHINLKTLV LDNNQIKDIS TLGELMNLKV LSLNDNQIEN IDSLTGLNQL 
EVLYISGNRI RNIKPLLKLN NLSVVAIKNN QFKLDEDVIK KLEDNKVTVV Y