Gene Hore_23190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_23190
Symbol
ID	7314202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2534773
End bp	2536878
Gene Length	2106 bp
Protein Length	701 aa
Translation table	11
GC content	46%
IMG OID	643612771
Product	alpha-glucosidase
Protein accession	YP_002510059
Protein GI	220933151
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.243429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGGAA GGAGTATGAT CGGAAGGAGT ATTACTATAA CAGGTTTTAT CATAATAACA 
GTAATTGCTG TTTTTGTACT GGCTACAGGA GTATTTGCTA AAGGTCATGA TCAGGGAGAT 
GAATCTGTGG TTACATCTCC TGATGGGAGG ATAAAGGTCA GGTTCATCCT TGATAAAGGA 
GTACCCCACT ATTCGGTATC CTACGGAGAC ACTGTCCTCA TCAGGCCATC TTCACTGGGG 
TTCCATTTCA AAGAGAAAAA ACCCCTTGAT GATAACTTTA AGATAATAGA TGTCAGGAGG 
AATGTCTTTT ATAATACCTG GCGTCCGGTC TGGGGGCAGA CGTCAAAGAT AACCAATTAC 
TACAATGAGC TGGTGATATA TCTCAAAGAA GAGGTGCCCC CCTACCGGAA GATGAATCTT 
GTTTTCCGGG TCTATAATGA TGGGGTCGGC TTCCGGTATA TTATCCCCGG GCAGGAGTCC 
CTGGAGACAA TAAATATTAT GTCAGAGGAT ACTGAGTTCC GTCTATCCAG TAATAATACT 
ACATGGTGGA TCCACAATGA CTGGGACAGT TACGAGTATC AGTATCTGGA GACACCGTTA 
AACCATGTAA TGTCTGCCAG TACTCCGGTT ACCATGAAAA CCCCCGGGGG AATTTACCTA 
AGTATTCATG AAGCTGCCCT GGTCGACTAT GCCGGAATGG CCCTCAAGCG TGATCTTGAC 
CGGGATTACA CCCTGGTAAG TGAGCTCTGT CCCTGGCCCG ATGGTGTCAA AGTTAAGGGA 
CGGACACCCC TGAAAACACC GTGGCGGACC ATTCAGATAG GAGCAGCCCC CGGTGACCTG 
TTAGAATCTA ATCTAATTTT GAACTTAAAT GACCCCTGTG CCCTTGAGGA TACTTCCTGG 
ATTCAACCCA TGAAGTACGT GGGAATCTGG TGGGAGATGC ATATCGGGAA GTCAACCTGG 
GAAGCAGGGC CGAGACACGG AGCTACCACG GAGCGGGCCA AATACTATAT TGATTTTGCC 
GGTAAACACG GTATCGGTGG AGTACTGGTA GAGGGATGGA ATCTGGGCTG GGGTGGAACC 
TGGGATGATC AGGACTATAC TACCCCTTAC CCCGACTTTG ACCTTGTAGA GGTTGCTAAA 
TATGCTGAAG AACGTGGGGT TGAATATATT GCCCATAACG AAACAGGTGG CAATGTCATC 
AATTATATTA ACCAGATAGA GGAGGCATAT AGTCTCTATA ATAGCCTTGG TATACATGCC 
ATCAAGACCG GATATGTTGC TGATAATGGC ATGATTAAAC CCAGGGGTCA GCATCACCAC 
GGCCAGTGGA TGGTTAACCA CTATCTGGAT GTAATTAAAA AGGCGGCAGA GTATGAAATT 
ATGATTGATG CCCATGAACC GATTAAGCCG ACCGGTCTTT ACCGAACTTA CCCTAACTTT 
ATAACCCGGG AGGGGGTTCA GGGCATGGAA TATAATGCCT GGAGTGCTGG AAATAAACCT 
GAACATACTA CCATAATTCC CTTTACCAGA ATGCTGGCCG GGCCCATTGA TTATACCCCG 
GGTATATTTG ATATAACCTT CGATGAATAC AGGTTTTTAA ACCGGGTTCA TACCACAAGG 
GCCAAACAGC TGGCACTCTA TGTTGTTATC TTCAGTCCCC TCCAGATGGT AGCTGATCTC 
CCGGAAAATT ATCTTGATGA TAATGGCAAT CCCCTGCCTG AATTTAAATT TATTCAGGAT 
GTACCGGTTA CCTGGGACGA AACCCTGGTG CTTAATGCCA GGATAGGTGA TTATGTCACC 
ATTGCCCGGC GCCGGGGTCA GGAATGGTAT GTAGGGAGTA TTACCGATGA AAAGCCGAGA 
AGACTCATGG TTCCCCTGGC TTTCCTTGAG GATGGGCAAA AATATGTAGC TGAAATTTAT 
GAGGATGGTC CGGAGGCTGA TTTAAAACAT AATCCGACCC AGGTGGCCAT CAGAAGGGTT 
ATTGTTGACT CCAATGATAC CCTGGTTGCC GATATGGTAG AAAGCGGGGG CCAGGCCATC 
AGACTTTATC CAGCCAGGAA TGAAGATGTT AATAAACTGC CGGAATTTAA TCAAAAGAAG 
AACTAA

Protein sequence

MTGRSMIGRS ITITGFIIIT VIAVFVLATG VFAKGHDQGD ESVVTSPDGR IKVRFILDKG 
VPHYSVSYGD TVLIRPSSLG FHFKEKKPLD DNFKIIDVRR NVFYNTWRPV WGQTSKITNY 
YNELVIYLKE EVPPYRKMNL VFRVYNDGVG FRYIIPGQES LETINIMSED TEFRLSSNNT 
TWWIHNDWDS YEYQYLETPL NHVMSASTPV TMKTPGGIYL SIHEAALVDY AGMALKRDLD 
RDYTLVSELC PWPDGVKVKG RTPLKTPWRT IQIGAAPGDL LESNLILNLN DPCALEDTSW 
IQPMKYVGIW WEMHIGKSTW EAGPRHGATT ERAKYYIDFA GKHGIGGVLV EGWNLGWGGT 
WDDQDYTTPY PDFDLVEVAK YAEERGVEYI AHNETGGNVI NYINQIEEAY SLYNSLGIHA 
IKTGYVADNG MIKPRGQHHH GQWMVNHYLD VIKKAAEYEI MIDAHEPIKP TGLYRTYPNF 
ITREGVQGME YNAWSAGNKP EHTTIIPFTR MLAGPIDYTP GIFDITFDEY RFLNRVHTTR 
AKQLALYVVI FSPLQMVADL PENYLDDNGN PLPEFKFIQD VPVTWDETLV LNARIGDYVT 
IARRRGQEWY VGSITDEKPR RLMVPLAFLE DGQKYVAEIY EDGPEADLKH NPTQVAIRRV 
IVDSNDTLVA DMVESGGQAI RLYPARNEDV NKLPEFNQKK N