Gene Hore_19800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_19800
Symbol
ID	7312795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2131696
End bp	2132706
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	38%
IMG OID	643612426
Product	transcriptional regulator, LacI family
Protein accession	YP_002509722
Protein GI	220932814
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	73
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACAA TAAAAGACAT TGCAAAACTT GCAGGTGTTT CAGTAACTAC AGTATCAAAA 
GTTATCAATA ATTATCCTGA TATTAGTGAT AAAACAAAGG AAAAGGTTAT AAAAATCATG 
GAACAGCAAA ATTACCGCCC TAATGCTATT GCCAGAAGCC TGTCAACAAG CCGTTCGCGG 
TCAATAGGAG TATTTTTTAC AGACCATTTA AATAGTGGGT TGAGGCACCC CTTTTTCAGA 
GATATTATTT ACGGGATCGA AAAGACATTT TTCCGAAAAG GGTATGACCT GATTTTATTT 
GCCCATCAAT GGGGAGACAG GTTCAGTTAT ACAGAAAAGT GTAAAAGTCG TCATGTTGAT 
GGTGCCATCT TAATGGGGAT GCCGAGGACT GATCCCAATC TTGATAAATT AGTTAATTCA 
AATATACCAA CAGTATTTAT AGACCTCGAT ATAGTTGGCA AAAATGCTAC GTATGTGATA 
TCCGATAATG TTCAGGGGGC AAAACAGGCT GTGAATTATC TTTATTCCCT TGGCCATATA 
AAAATAGGTA TGATTATGGG ACAGCGGATT ACTAAACCGG CACAGGATCG CCTGATTGGT 
TTTCAGGAAG AGTTAACGAA TTTAGGTCTG GAGTATAACC CGGAATGGAT TATAGAGGCT 
GAATTCGGAG AAGAAGGCGG TTATCAAGCT ATGAAAAGGA TTATTACCCA GGAGATAAGA 
CCATCTGCTG TGTTTTGCCA GGGTGATGAA ATGGCCATTG GAGCTATTAA CGCTATAAAA 
GAACATGGTT ACAATGTACC TCAAGATTTT TCTATAGTTG GCTTTGATAA TATTGAAATA 
AGTAGTTATG TTTCCCCTGG TCTTACTACA ATCCATCAGG ATAAATTGAC TATGGGAAAG 
AAGGCCGCCA GTATTCTTCT GGAAATGATT AATAACCCAA ACAAAACCTT TTCTCCCGTA 
GTGTTACCAA CAAAATTAAT CGAGAGGGAG TCATGTAGAA AGATTGGATA G

Protein sequence

MATIKDIAKL AGVSVTTVSK VINNYPDISD KTKEKVIKIM EQQNYRPNAI ARSLSTSRSR 
SIGVFFTDHL NSGLRHPFFR DIIYGIEKTF FRKGYDLILF AHQWGDRFSY TEKCKSRHVD 
GAILMGMPRT DPNLDKLVNS NIPTVFIDLD IVGKNATYVI SDNVQGAKQA VNYLYSLGHI 
KIGMIMGQRI TKPAQDRLIG FQEELTNLGL EYNPEWIIEA EFGEEGGYQA MKRIITQEIR 
PSAVFCQGDE MAIGAINAIK EHGYNVPQDF SIVGFDNIEI SSYVSPGLTT IHQDKLTMGK 
KAASILLEMI NNPNKTFSPV VLPTKLIERE SCRKIG