Gene Hore_18730 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_18730
Symbol
ID	7312687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2001024
End bp	2002352
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	38%
IMG OID	643612320
Product	cytoplasmic alpha-amylase
Protein accession	YP_002509617
Protein GI	220932709
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGTTT TTAGAAGGCG TCTTTTCATT GTTTTGTTCA GTCTGCTTCT GTTGATTTCA 
GTTATTACTT CTGCAAGGGC CGGGGTGTTG ATGCAAGGGT TTTACTGGGA TACTCCATAT 
CAGGGAGAGT GGTATGACCA TATAGCCTCC AAAGCTGAAG AACTTTCAAA TGCTGGATTT 
ACTGCAATAT GGTTTCCTTC GCCATGTAAA GGTGATAGTG GCGGTTATTC CATGGGTTAT 
GACGTTTTTG ATCATTATGA CCTGGGGAAT TATTACCAGC AGGGGACTAC TGAAACCCGA 
TTTGGGAGTA AAAATGAACT GTTAAATGCA ATCAATGCTT ACCACAGTGA AGGAATGCAG 
GTGTATGTTG ATACTGTCAT GAACCACATG ATGGGTGGTG AACAGGAATG GAATCCGAAT 
ACAAATTCGT ATACATATAC CAGGTTTGAT TACCCCCACG ATACTTTTGA AAAGAATTAT 
AAACATTTTC ATCCAAATTA TACCCACCCA GATAATGACC CCCCTTATCA TAGTAAAGAA 
TTTGGCGAAG ATGTCTGTTA TTATAATGAC TATAACTATA TGGGGAATGG GTTAAAAAAT 
TGGGCAGCCT GGTTAAAGAA TAATATTGGA TTTGATGGGT ATAGATTAGA TTTTGTTAAA 
GGTATAGAAC CTGATTATAT TAAATCCTGG AAACAAACTT CTCCAATGAG TAGTAGTTTT 
GTCGTGGGTG AATACTGGGA TGGTAACAGG GATACCCTGG ATTGGTGGGC AAATTATACT 
GGTTGTCATG TTTTTGACTT TGCATTATTT TACACATTAA AAGATATGTG TAATAGCGAC 
GGCTACTATG ATATGAGAGG GCTACAGGAT GCAGGGTTGG TGGAAATAAA CCCTTACAGG 
GCGGTAACAT TTGTAGAAAA CCATGATACA GATGAACATG ACCCGGTAAC AAAAAATAAA 
TTAATGGCCT ATGCTTATAT TTTAACCCAT GAGGGTTATC CTACAGTATT TTGGAAAGAT 
TATTATGTAT ATGATTTAAA GGATGAAATA AATAACCTGG TCTGGATACA TGAGAACCTG 
GCCTCAGGAA CTACCAGTAA TCTTTACGCT GATGATAGTT TGTATATTGC CCAACGAAAT 
GGTAATCCCG GACTTGTGGT CGGGCTCAAC GATAGTTCCA GTTGGAAGAG TAAATGGGTT 
CAAACTAAAT GGAGTAATGT TACTTTACAT GACTATACCG GACAGGCCGG AGATGTATAT 
GTGGATAGTA ACGGCTGGGT AGAAATTTCA ATACCACCAA AAGGATATAG TGTCTACTCT 
CCATATTAA

Protein sequence

MKVFRRRLFI VLFSLLLLIS VITSARAGVL MQGFYWDTPY QGEWYDHIAS KAEELSNAGF 
TAIWFPSPCK GDSGGYSMGY DVFDHYDLGN YYQQGTTETR FGSKNELLNA INAYHSEGMQ 
VYVDTVMNHM MGGEQEWNPN TNSYTYTRFD YPHDTFEKNY KHFHPNYTHP DNDPPYHSKE 
FGEDVCYYND YNYMGNGLKN WAAWLKNNIG FDGYRLDFVK GIEPDYIKSW KQTSPMSSSF 
VVGEYWDGNR DTLDWWANYT GCHVFDFALF YTLKDMCNSD GYYDMRGLQD AGLVEINPYR 
AVTFVENHDT DEHDPVTKNK LMAYAYILTH EGYPTVFWKD YYVYDLKDEI NNLVWIHENL 
ASGTTSNLYA DDSLYIAQRN GNPGLVVGLN DSSSWKSKWV QTKWSNVTLH DYTGQAGDVY 
VDSNGWVEIS IPPKGYSVYS PY