Gene Hore_00510 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_00510
Symbol
ID	7314268
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	56965
End bp	59133
Gene Length	2169 bp
Protein Length	722 aa
Translation table	11
GC content	41%
IMG OID	643610468
Product	RNA binding S1 domain protein
Protein accession	YP_002507807
Protein GI	220930899
COG category	[K] Transcription
COG ID	[COG2183] Transcriptional accessory protein
TIGRFAM ID	[TIGR00426] competence protein ComEA helix-hairpin-helix repeat region

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000000209068
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCAAA GAATAATTGG ACAAATCTCT AAAGAATTAA AACTGAAAAC TAACCAGGTA 
AAAGGAACGG TTAAACTTCT TGATGAAGGT AATACCGTTC CTTTTATTGC GCGTTACCGT 
AAAGAAGTGA CTGGAGGACT TGATGAAGCA CAGATAAGGA CTATTGAAGA AAGACTGGAA 
TACCTCCGCA GTCTTCAAAA GCGGAAGGAA GAAGTTATAA GGCTGATTGA AGAGCAGGGA 
AAGTTAACTC CGGAACTTGA AGAAAAGATT AAAAAAGCTT CCATTTTACA GGAAGTAGAA 
GATCTCTACA GGCCTTATAA GCAGAAGCGG CGGACCCGGG CTACCAGGGC CAAAGAAAAA 
GGCCTTGAAC CCCTGGCTAA GTTAATGTGG ACACAAGAAC TTACTTCTGG TAATCCTGAA 
GATATAGGTA AGGAATATAT CAACCCCGAA GTTGAACTGG AGAGCATTGA AGATGTTTAT 
CAGGGAGCCA GGGATATTAT AGCAGAATGG GTTTCAGATG ATGCCGGAAT TAGAAAAGAA 
ATCAGGAAAA TAACCTTTAA GCAGGGAGTT ATTCAGAGCA CCTGTAAAGA TAGTGAGACC 
GATGATGAAG GCAAATATGA GATGTATTAT GATTACAGGG AACCTGTCAG TAAAATACCA 
CCCCACCGGG TTCTGGCTAT TAACCGGGGG GAGAAAGATG AAGTGCTCCA GGTTAAGGTT 
TTAGCTCCTG AAGAAGATAT TATAGAATTA ATCAAGGATA GGGTGGTTAA CAATCCTGAA 
AGTATATTTT ACAATGATAT AATTGAAGCT ATTAAAGATG GATATAAAAG GTTAATTGCT 
CCTTCCATTG AAAGGGAGGT TAGAAATAGT CTTACTGAAA AAGCAGAAGA GCATGCCATA 
AATATTTTTT CTAAAAACCT TCGCAATCTG CTTTTGCAGC CACCACTCAG AGGTCATACT 
GTTATGGGAA TTGACCCTGC CTATAGAACG GGTTGTAAAG TCTGTGTTGT GGACCCGACC 
GGGAGGTTAC TGGATACAGC AACTATTTAC CCCCATCCGC CCCAGAGCCG GACAGGTGAA 
GCTAAAAAGG TTGTTAAAGG TTTGATAAAT GAATACCAGG TTACTACGAT TGCTATCGGG 
AATGGGACAG CATCCCGGGA AACCGAGTTT ATGGTTGCTG ATATAATTAA GGAACTTAAA 
AACACTCAGG TTAACTATGT AATAGTAAAT GAAGCCGGGG CTTCAGTTTA TTCTGCATCC 
AAACTGGCCA GAAAAGAGTT TCCTGAACTC GATGTAGCCA TGAGAGGAGC CATTTCCATT 
GCGAGGCGGT TACAGGACCC CCTGGCTGAG CTTGTTAAAA TAGATCCCAA ATCCATTGGG 
GTTGGTCTTT ATCAGCATGA TGTTAATCAA AAAAACCTTG AAAAATCCCT CGGTAATGTA 
GTGGAATCGG CCGTTAATTA TGTTGGAGTT GATTTAAATA CAGCTTCGCC ATCCCTTTTA 
AAATATGTGG CCGGTATTAA TAGCCGGGTG GCGTCAAATA TTGTTAAATA CCGTGAGGAA 
AATGGTAAAT TTGAAACCAG GGATGAATTA TTAAAGGTGA AGGGTCTGGG TAAAAAAACA 
TTTACCCAGG CAGCTGGTTT TTTAAGAATA CCGGATGGAA CAAATCCCCT GGATAATACC 
CCAATCCATC CTGAATCCTA TCAGGCCGCT AAAGGTCTAT TACAGGATGT CGGGTTTAAA 
CTGTTAGATA TTACTGATAA GGAAAAGCTT AAGGAAGTGC GTGAAGAGCT GGACTCCATC 
AATATAAAAT CCAGGGCTGA AAAACTGGAG ACAGGAATAC CAACTTTAAA AGATATTGTA 
GATGCTTTAA AAAAACCGGG ACGCGACCCG CGTGATGAAT TACCTAAACC TATCTTCAGG 
TCTGATGTAT TGAAAATGGA AGATTTAGAG GCTGGCATGC TCCTTCAGGG TACGGTCCGG 
AATGTAGTGG ATTTTGGTGC TTTTGTTGAT ATTGGGGTCA AGGTGGACGG GCTTGTTCAT 
ATTTCTGAAA TGAGTCATGA TTATGTAGAT GATCCCCTCA AGGTGGTACA GGTAGGGGAT 
ACTGTAAAGG TTAAAATATT AGAGGTAGAT GAGAGGCGAA ACAGGATTTC CCTGAGTATG 
AAGTTGTAG

Protein sequence

MNQRIIGQIS KELKLKTNQV KGTVKLLDEG NTVPFIARYR KEVTGGLDEA QIRTIEERLE 
YLRSLQKRKE EVIRLIEEQG KLTPELEEKI KKASILQEVE DLYRPYKQKR RTRATRAKEK 
GLEPLAKLMW TQELTSGNPE DIGKEYINPE VELESIEDVY QGARDIIAEW VSDDAGIRKE 
IRKITFKQGV IQSTCKDSET DDEGKYEMYY DYREPVSKIP PHRVLAINRG EKDEVLQVKV 
LAPEEDIIEL IKDRVVNNPE SIFYNDIIEA IKDGYKRLIA PSIEREVRNS LTEKAEEHAI 
NIFSKNLRNL LLQPPLRGHT VMGIDPAYRT GCKVCVVDPT GRLLDTATIY PHPPQSRTGE 
AKKVVKGLIN EYQVTTIAIG NGTASRETEF MVADIIKELK NTQVNYVIVN EAGASVYSAS 
KLARKEFPEL DVAMRGAISI ARRLQDPLAE LVKIDPKSIG VGLYQHDVNQ KNLEKSLGNV 
VESAVNYVGV DLNTASPSLL KYVAGINSRV ASNIVKYREE NGKFETRDEL LKVKGLGKKT 
FTQAAGFLRI PDGTNPLDNT PIHPESYQAA KGLLQDVGFK LLDITDKEKL KEVREELDSI 
NIKSRAEKLE TGIPTLKDIV DALKKPGRDP RDELPKPIFR SDVLKMEDLE AGMLLQGTVR 
NVVDFGAFVD IGVKVDGLVH ISEMSHDYVD DPLKVVQVGD TVKVKILEVD ERRNRISLSM 
KL