Gene Hore_08020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_08020
Symbol
ID	7314789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	861481
End bp	862767
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	40%
IMG OID	643611233
Product	Homoserine dehydrogenase
Protein accession	YP_002508554
Protein GI	220931646
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.00145956
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAAAA TAGGTTTACT GGGTCTGGGT ACTGTCGGTA GTGGAGTTGT TACAATTATG 
GAGAACAATA AGGAGAGTAT AAGGAGAAAA GTGGGGACCT CTCTAGCAAT AGAGAAGGTT 
CTAGTTAAAA ATCTTGACAA GGAAAGGGAC CTGGATATTG ATTCCAGGGT GTTGACCAGT 
AATATTGAAG ATATAGTCTA CAATCCTGAT ATTGATCTTG TTGTGGAATT AATTGGTGGT 
GAAGAACCTG CCTGCCAGTA TATTAAAGAG GCTATAAATA GGGGGAAGAG TGTTGTTACT 
GCCAATAAAT TGGTTATAGC CAAACATGGT ACTGAGATCT TAAAACTGGC CCGGGAAAAA 
GGGGTTCAGG TCAGCTATGA GGGTAGTGTT GGTGGTGGAA TTCCTATTAT CAGGCCATTG 
AAGGAATCAC TGGCGGCAAA CCGGATTCAT GAAATTTATG GTATTCTAAA TGGTACCACC 
AATTATATTC TAACTAAGAT GACCAGAGAG GGGAGAAAAT TTCAGGAAGT ACTGGCTGAA 
GCCCAGAAAC TAGGATATGC TGAAAGTGAT CCCTCTTCTG ATATTGAAGG TTATGATGCT 
GCCTATAAAA TAGCTATACT GGCCTCTATT GCCTTTGAAA CATCTATTGA CATCAGTTCG 
GTTTATGTAG AAGGTATTGA TGGTATCAGT GTTGATGACA TTGAACTTGC CCGGGAACTG 
GGTTATGTTA TAAAATTATT AGCTATAGGA AAAAGGTGTG AACGTGGTCT CGACATCAGG 
GTCCATCCCA CCTTTATTCC CAGAAGCCAT CCTCTGGCCC TGGTAAGTGA TGTTTATAAC 
GCTGTTTATT TACATGGTGA TGCAGTAGGG GATGTTATGT CCTATGGTAA AGGGGCTGGA 
CAGATGCCGA CCGGTAGTGC TGTAGTTGCT GACATTATTC AGGTGGCAAG AGATATTCAT 
TCTGGTAGAG TTGTGACCCC GTCCCTGGAC ACGACTATAA AACACAGGGT AGTTGATATA 
AATGAAATTG AGAATAGTTT TTATCTGAGA TTACAGGTTA GAGATAAGCC GGGAGTTTTA 
GCCCAGATTA CTAAAGTTTT AGGTGATAAT AAGGTAAGCC TTGCTTCTGT CTTACAAAAG 
CATCGATTAA CAACTGTAGT ACCCCTGGTG TTAATAACCC ATCCTGTTAA AGAGCAATTT 
ATTAATAAGT CATTAAAGGA ATTAAAGAAG ATTGAAGATG TTGTTAGCAT TGATAGTTTA 
ATAAGGGTTG AGGAGGAATC AATATGA

Protein sequence

MIKIGLLGLG TVGSGVVTIM ENNKESIRRK VGTSLAIEKV LVKNLDKERD LDIDSRVLTS 
NIEDIVYNPD IDLVVELIGG EEPACQYIKE AINRGKSVVT ANKLVIAKHG TEILKLAREK 
GVQVSYEGSV GGGIPIIRPL KESLAANRIH EIYGILNGTT NYILTKMTRE GRKFQEVLAE 
AQKLGYAESD PSSDIEGYDA AYKIAILASI AFETSIDISS VYVEGIDGIS VDDIELAREL 
GYVIKLLAIG KRCERGLDIR VHPTFIPRSH PLALVSDVYN AVYLHGDAVG DVMSYGKGAG 
QMPTGSAVVA DIIQVARDIH SGRVVTPSLD TTIKHRVVDI NEIENSFYLR LQVRDKPGVL 
AQITKVLGDN KVSLASVLQK HRLTTVVPLV LITHPVKEQF INKSLKELKK IEDVVSIDSL 
IRVEEESI