Gene Hore_09460 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_09460
Symbol
ID	7313439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	1019366
End bp	1021057
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	38%
IMG OID	643611385
Product	alpha amylase catalytic region
Protein accession	YP_002508697
Protein GI	220931789
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0188478
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTAAAA AAGAGAAAAG CTGGTGGAAA GAGGCGGTAG TTTATCAAGT ATACCCGCGT 
TCTTTTAATG ATACTACTGG TAATGGTATC GGGGACTTAA GGGGTATTAT TGAAAAGCTC 
GATTATATAA AAGACCTTGG TGTTGATGTT ATCTGGTTAA ATCCCGTTTA CGAGTCTCCA 
TGTGATGACA TGGGGTATGA TATTAGCAAT TATAGAAAAA TATTACCCCA GTTTGGCACC 
ATGGAGGATT TTGATCTTCT CCTCTCTGAA ATGCATAAGC GGGGATTAAA ACTTGTCATG 
GATCTGGTAG TGAATCATAC TTCTGATGAA CATCGCTGGT TTGTTGAGTC CAGGAAGTCC 
AAAGATAATC CCTACCGGGA TTATTATATC TGGAAAAAGC CAAAAGCTGA TGGTAGCCCT 
CCCAACAACT GGGTTTCCTA TTTCGGGGGT TCTGCCTGGG AGTATGATGA ACAAACCGGT 
GAATATTATC TCCATCTGTT TTCCAAAAAA CAGCCTGATT TGAACTGGGA AAACCCAAAG 
GTCAGAGAAG AAGTAAAGGA TATAATGCGT TTCTGGCTTG ATAAAGGTGT CGATGGATTT 
AGAATGGATG TTATTGGATT TATTTCAAAG GATCCTGATT TTGAAGATTT TCCAACTGAT 
AATCCCAGTG GGAAGGATCT TGGTGATAAA TATGCCAATG GGCCCAGATT ACATGAATTT 
TTACAGGAAC TCCATGATGA TGTTCTTAGT CACTATGACT GTATGACCGT TGGAGAATGC 
CCCGGAGTAT CACCTGAAGA TGCCCTGTTA ATAGTTGGTA AAGACAGGCG AGAACTCCAG 
ACTCTCTTTC AATTTGAGGG AATGGACATT GATTATGGTA AAAATGGAAG CCGCTTCAGT 
ATAGGTAACT GGGATGTTCA TGGTTTTAAA AAAGTATATA CAAAATGGCA TAAAAAGTTA 
TATGGTAAGG CCTGGAACAG TATTTATCTT ATGAACCATG ACCAACCACG GGCAGTGTCC 
AGGTTTGGTG ATGATAAAAA ATACCGCAAA GAATCTGCTA AAATGTTAGC AACCTTCCTG 
CTGTCTATGT GGGGTACCCC CTATATCTAT CAGGGGGAAG AAATAGGTAT GACAAATTGC 
CCCTTTGAAG GTGTGGAAGA ATTCCGGGAT ATTGAAATGA TTAATTATTA TAATGAACAG 
ATAAGTAAGG GTAAAACTAA GGAAGAAATA ATGCCCGGAT TATTATACAG AGGACGGGAT 
AATTCCAGGA CTCCAATTCA ATGGAATGAC TCCAGAAATG CAGTTTTTTC TGATGCTGAA 
GAGACCTGGA TAAAGGTAAA CCCCAATTAT ACTGAAATTA ATGTTGAAGA AGCTGAAAAA 
GACCCTGATT CAATTCTCCA TTATTTCCGT CGTATGATTA AAACCAGGAA AGATAATGAT 
GTTCTAATAT ATGGTGACTA TGAACTGGTA GATGAAGGAA ATGACGATGT GTATGCCTAT 
CGAAGATTTC TAGACAATGA AGAAATGCTT GTTCTTCTAA ACTTTACAGA TAAAGAGACA 
AGCTGTGATG TTAGCCCTTA TAACTTAGAA GATAAAGAGC TGATTATCTC TAATTATAAG 
GGGGGTCAAA AGGTCAAAGG AACTGAAGTG ACTTTAAGGC CTTATGAAGC CAGGATCTAT 
AAGATAAAAT AA

Protein sequence

MTKKEKSWWK EAVVYQVYPR SFNDTTGNGI GDLRGIIEKL DYIKDLGVDV IWLNPVYESP 
CDDMGYDISN YRKILPQFGT MEDFDLLLSE MHKRGLKLVM DLVVNHTSDE HRWFVESRKS 
KDNPYRDYYI WKKPKADGSP PNNWVSYFGG SAWEYDEQTG EYYLHLFSKK QPDLNWENPK 
VREEVKDIMR FWLDKGVDGF RMDVIGFISK DPDFEDFPTD NPSGKDLGDK YANGPRLHEF 
LQELHDDVLS HYDCMTVGEC PGVSPEDALL IVGKDRRELQ TLFQFEGMDI DYGKNGSRFS 
IGNWDVHGFK KVYTKWHKKL YGKAWNSIYL MNHDQPRAVS RFGDDKKYRK ESAKMLATFL 
LSMWGTPYIY QGEEIGMTNC PFEGVEEFRD IEMINYYNEQ ISKGKTKEEI MPGLLYRGRD 
NSRTPIQWND SRNAVFSDAE ETWIKVNPNY TEINVEEAEK DPDSILHYFR RMIKTRKDND 
VLIYGDYELV DEGNDDVYAY RRFLDNEEML VLLNFTDKET SCDVSPYNLE DKELIISNYK 
GGQKVKGTEV TLRPYEARIY KIK