Gene Hore_16050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_16050
Symbol
ID	7312641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	1720418
End bp	1721386
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	44%
IMG OID	643612052
Product	glucokinase
Protein accession	YP_002509349
Protein GI	220932441
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID	[TIGR00744] ROK family protein (putative glucokinase)

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAT ACTATGTAGG TGTTGATTTA GGAGGTACCA AAATACTAAC TGCTCTGGCT 
GATGCCAGAG GAAAGATTGT TGCGAAAAAG AAGCTACCGA CAGAAGCCCG TAAAGGGGAA 
GAAAAGGTAA TACAAAATAT TGTGTCATCA ATAGATGCTG TTCTTCAGGA GAAAGGACTA 
TCAAGGGAAG ATGTCATTAC TCTGGGTGTC GGAAGCCCCG GGCCCTTAAA TACACAGGAG 
GGTATTATAT ACCTGGCCCC TAATCTGGGA TGGAGGAATG TACATATTAA AGATATCCTT 
GAGGAGGAAA CAGGTATTCC GGTAATCCTG GAAAATGACG CCAATGCAGC GGCCCTCGGA 
GAAAAATGGT TTGGGGCCGG CCAGGATGTT GACAACTTAA TATATATTAC TGTCAGTACC 
GGTATCGGAG GCGGAATTAT TATTAATAAG AAAATTTTCC ATGGTATCAA TGATGGAGCC 
GGTGAGGTTG GACATATGGT TATAGAGCCA GGTGGACCTG TCTGTGGTTG TGGTAACAGG 
GGTTGTTTTG AGGCCGTTGC TTCCGGGACT GCCATTAATA AAATGGGCCG GGAGGCTGTA 
AAAGAAAATA AAGCTACCCT GTTAATGGAA TTATCAGGAG GAGATCCCGA GAAAATTGAC 
GGAAGTTTAA TTGCCAGAGC TGCCAGGCAG GGAGATGAAG TAGCCAGGAA AATATGGGAT 
AAGGCCGGTT ATTATCTGGG GATTGGACTT GCCAACCTTT TAAATATTTT TAACCCGGAA 
ATGATAATTC TGGGTGGTGG TGTCATGAAT GCTGGTGATT TAATAATGGA ACCAATGAAA 
AAAAGCTTAA AAGATCATGC TTTAGAATCA GCCTTTAATT CAGTTGAGAT ACGCCAGGCT 
GAGCTGGGCA ATGATACTGG AGTAATCGGG GCAGTTGCAG TAGCCATGGG GGACAGGTTA 
TTAGAATGA

Protein sequence

MKEYYVGVDL GGTKILTALA DARGKIVAKK KLPTEARKGE EKVIQNIVSS IDAVLQEKGL 
SREDVITLGV GSPGPLNTQE GIIYLAPNLG WRNVHIKDIL EEETGIPVIL ENDANAAALG 
EKWFGAGQDV DNLIYITVST GIGGGIIINK KIFHGINDGA GEVGHMVIEP GGPVCGCGNR 
GCFEAVASGT AINKMGREAV KENKATLLME LSGGDPEKID GSLIARAARQ GDEVARKIWD 
KAGYYLGIGL ANLLNIFNPE MIILGGGVMN AGDLIMEPMK KSLKDHALES AFNSVEIRQA 
ELGNDTGVIG AVAVAMGDRL LE