Gene Hore_20690 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_20690
Symbol
ID	7314393
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2238347
End bp	2239498
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	40%
IMG OID	643612513
Product	ROK family protein
Protein accession	YP_002509809
Protein GI	220932901
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA TAAACCAGCA GACAATTTTA GAATTAATAA ATAATAAAGG GCCTATTTCC 
AGGGCTGAAA TAGCTGAGAT TACTGGATTA ACGCCGGCTA CTGTCTCCAA CATAGTAAAG 
GATCTCCTTA AGATGGATCT GGTCAGAGAA ACCCGGCAGG GAGAATCCCG GGGAGGAAGA 
AAACCCATCT TACTGGAGGT AAATCCAGAA GGAGCCTACG TAATCGGCCT TGAATGGGGA 
ATAGGGGAAA TAAAGGCTGT TCTACTTAAT TTAAATAAGA AGGTAATTAA AACTATAAAA 
AAACAGGTAG ATAGTTTTAA ACCTGAGTGG TTTTTAAAGA CTACAGTAAC AATATTTGAA 
GAGGTTACTG GTTATGTAGA AAATCCAGAT AAGGTATTTG GTCTCGGGAT AGGGATTCAT 
GGTTTAGTTG ATCCAGATGA AGGTGTTTCC CTGTATGCCC CCCATTTTGG CTGGGAGAAT 
ATTAAAATAG GTAAATTATT AAAACAGGAA TTACAGATTC CTATTATGCT GGATAATGAT 
GTCAGGATGA TGGCCCTGGC TGAAAAATGG GAAGGCAGGG ATAATTTTAT ATTTATTAAC 
ACCGGGCCAG GGATAGGTTC AGCTATAGTT ATTAAAGGAG AACTCCTCTA TGGTAGAGAT 
TTCGGAGCCG GGGAATTCGG CCATATGACT ATTGTTGAAG ATGGGGCCCT CTGTAGTTGT 
GGTAATCGCG GTTGTATTGA AGCCCTGGTT TCTGTTAATA ACCTTGTCAG GGAATATAAT 
GATTCACTAC CGGAACATAT ATCATTCCAT GATATAAAGC GGGAGTGGAA TCTTTTAATA 
GATTTAGCCC GTGAAGAAAA ATCCAGGGCC TATTCTATAA TTGAAAAGGC GGGCGTGTAT 
CTAGGTAAGG GAATAGGAAA TGTGGTTAAT CTTTTAAACC CGGAAGCGGT AGTAATCGGA 
GGAGACTTTT TACTGGCCAG GGATTTGATT TTTCCGGTTA TTAAAGAACA GGTATTAGAG 
ACTGCCCTTA AGGTTCCGTC AAGGGACCTT GAAATAACAG GGACTGCTTT TGGTGAGAAG 
GTTGGTGCTA TCGGGGCCGG TACCAGAGTC CTGCAGGAAA TTTTTAAATT AAAAAAGGAG 
GAAGATAAAT GA

Protein sequence

MKKINQQTIL ELINNKGPIS RAEIAEITGL TPATVSNIVK DLLKMDLVRE TRQGESRGGR 
KPILLEVNPE GAYVIGLEWG IGEIKAVLLN LNKKVIKTIK KQVDSFKPEW FLKTTVTIFE 
EVTGYVENPD KVFGLGIGIH GLVDPDEGVS LYAPHFGWEN IKIGKLLKQE LQIPIMLDND 
VRMMALAEKW EGRDNFIFIN TGPGIGSAIV IKGELLYGRD FGAGEFGHMT IVEDGALCSC 
GNRGCIEALV SVNNLVREYN DSLPEHISFH DIKREWNLLI DLAREEKSRA YSIIEKAGVY 
LGKGIGNVVN LLNPEAVVIG GDFLLARDLI FPVIKEQVLE TALKVPSRDL EITGTAFGEK 
VGAIGAGTRV LQEIFKLKKE EDK