Gene Hore_20670 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_20670
Symbol
ID	7314391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2236262
End bp	2237251
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	42%
IMG OID	643612511
Product	galactose-1-phosphate uridylyltransferase
Protein accession	YP_002509807
Protein GI	220932899
COG category	[C] Energy production and conversion
COG ID	[COG1085] Galactose-1-phosphate uridylyltransferase
TIGRFAM ID	[TIGR00209] galactose-1-phosphate uridylyltransferase, family 1

Plasmid Coverage information

Num covering plasmid clones	65
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGAAT TAAGGTGGAA CCCGATTTTA AAGGAGTGGG TTATTACAGC AACCCACCGG 
CAGAACAGGA CTTTTAAACC ACCGAAGGAT TTTTGTCCCC TTTGTCCAAC CAGGGAAGGT 
GGCTTTCCCA CCGAAGTCCC GGCTGAAGAT TATGATATAG TTGTTTTTCA AAATAGATTT 
CCATCCCTGC AGCCAGATGC CCCCGAGCCC GATATAGAGG GTTCCGAATT GTATCCTGTA 
GATCTGGCAC AGGGTATATG TGAAGTCGTT TTATTTACAT CAGAGCATGA AGGGGTTATG 
TCCCAACAGC CGTTAAGTAA ATTTGAAAAA CTGGTTAAGG TCTGGAAGGA TCGTTATCAG 
GAACTGGGAA AAAAGGATTT TATAGATTAT GTATATATTT TTGAAAACAA AGGGGAGGAA 
GTCGGGGTTA CTTTACACCA TCCTCATGGC CAGATATATG CCTATCCCTT TATTCCCCCT 
ATAATAGAGC GGGAGTTAAA CTCAAGTAAG GAACATCTGG AAAAGGAAGG GGAATGCCTT 
TTCTGCAGGG TTCTCCGGGA AGAAAAGGAG GATGGCAGGC GGATAATAGC CAGTAATAAG 
TCTTTTACTG CCGTTATTCC CTTTTTTGCC CGATATACCT ATGAAGTTCA CATTTATGCC 
AACAAACATT TACCCTCAAT GGCTGAGTTC GGACCTGAGG AGGAAAAGGA CCTGGCCCGG 
ATATTAAAGT TATTAATTAT GAAATATGAT AATCTCTTTG AGTTTGTTTT CCCTTATATT 
ATGTGTATTC ACCAACAACC TACTGATGGT AGTGGTTTTG ACTATTCCCA TTTCCATATA 
GAGTTCTATC CACCATACCG GACAAAAGAC AAGTTAAAAT ACCTGGCCGG TAGTGAAGCC 
GGGGCAGGTA CTTTCATCAA CGGTTCTCTG GCTGAAAATA AAGCAGCTGT ATTGAGGGAA 
ACCAGTCCAG TTTCCTTTGA AGATATGTAG

Protein sequence

MSELRWNPIL KEWVITATHR QNRTFKPPKD FCPLCPTREG GFPTEVPAED YDIVVFQNRF 
PSLQPDAPEP DIEGSELYPV DLAQGICEVV LFTSEHEGVM SQQPLSKFEK LVKVWKDRYQ 
ELGKKDFIDY VYIFENKGEE VGVTLHHPHG QIYAYPFIPP IIERELNSSK EHLEKEGECL 
FCRVLREEKE DGRRIIASNK SFTAVIPFFA RYTYEVHIYA NKHLPSMAEF GPEEEKDLAR 
ILKLLIMKYD NLFEFVFPYI MCIHQQPTDG SGFDYSHFHI EFYPPYRTKD KLKYLAGSEA 
GAGTFINGSL AENKAAVLRE TSPVSFEDM