Gene Hore_18230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_18230
Symbol
ID	7313821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	1946127
End bp	1947287
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	44%
IMG OID	643612270
Product	transcriptional regulator, LacI family
Protein accession	YP_002509567
Protein GI	220932659
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTACAA TAAAAGATAT TGCAGAACGG GCCGGAGTCT CTACCGCTAC TGTATCCCGG 
GTTTTAAATA ACAGTCCCCG GGTTAAAGAG GAGACCAGGG TCCGGATTCT TGAGATTATT 
AAGGAGACCG GTTATGGGCG GTACCGGAAG GGTATTAAAA AGAGCCCTGA TAGTAAGGTG 
ACTATCAGGG AGGTAGCAAG GGAGGCCGGG GTATCAGTGG CCACTGTTTC CCGGGTCATA 
AATGGAGACA GTGCTGTGAG TCCTCAAACC CGGAACAGGG TAAAAAAGGC CATGCAGGCC 
CTGAACTATC ACCCCAATTT ACTGGGACGC CAGCTGAGGA GAAGGGAAAC AAAAAGTATT 
GGAATTATTA TCCCCGAGAT ATCAAACTTT TTCTTTGCCC GGGTCATCAA AGGGATTGAA 
AATGTGGCTG AATGTGAAAA CTATAACGTA ATTTTGATGG AGAGTAACAG AAAGGACCAT 
ATCGCGGCCA TAAAGGCCCT GTATGAGCGG CGGATTGATG GTTTAATCTA TATGACCGGC 
CACCTGACAA AACAGGAGAT TGATTTTTTC AGAGAGCTCA AATTACCGGT TGTACTCCTT 
TCCCAGGACT TTTGTGCTCC TGATATACCT TCAGTAAATA TTAATAATAG GGAAGCAGCG 
TTTGAAGCTG TGACCTACCT TCTAAAAAAG GGGTATAAAA GGATTGCTTT TCTGGGTGGT 
CCTTTTTCTG ACAGGGTATC TGTTTTCAAC CGGTTTAAAG GATACTGTGG GGCTTTAAAA 
GAGTATGGCC TAAAACCCGA TAAGCACTTG ATAAAAGAAG GTGAGTTTAG CCTGGAAAGC 
GGTTATGATA TGTGCTACCG GCTCCTTCAG GAAGGTCCAG AAGTTGAGGC AATATTTGCT 
GCCAATGATG AAATTGCCAT TGGTGTTATC AAGGCCCTTA CCGTGAAAGG ATATAAAATA 
CCCCGGGATA TTGCTGTGAT TGGCTTTGAT GACCTCCCTG TGGCCAGGTT TACAGTTCCT 
TCTCTCACCA CGGTCCATCA ACCTATTTAT AAAATGGGCC GGGAAGGAAT GAATCTCCTC 
TTGAAACTTA TCAAAAATAT TCCTTTAAAG GAATCCCATG TGACCTTGAA TCATAAACTT 
ATTATCAGGG ATTCGGCCTG A

Protein sequence

MVTIKDIAER AGVSTATVSR VLNNSPRVKE ETRVRILEII KETGYGRYRK GIKKSPDSKV 
TIREVAREAG VSVATVSRVI NGDSAVSPQT RNRVKKAMQA LNYHPNLLGR QLRRRETKSI 
GIIIPEISNF FFARVIKGIE NVAECENYNV ILMESNRKDH IAAIKALYER RIDGLIYMTG 
HLTKQEIDFF RELKLPVVLL SQDFCAPDIP SVNINNREAA FEAVTYLLKK GYKRIAFLGG 
PFSDRVSVFN RFKGYCGALK EYGLKPDKHL IKEGEFSLES GYDMCYRLLQ EGPEVEAIFA 
ANDEIAIGVI KALTVKGYKI PRDIAVIGFD DLPVARFTVP SLTTVHQPIY KMGREGMNLL 
LKLIKNIPLK ESHVTLNHKL IIRDSA