Gene Hore_04190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_04190
Symbol
ID	7314094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	442073
End bp	443410
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	39%
IMG OID	643610842
Product	glycoside hydrolase family 30
Protein accession	YP_002508172
Protein GI	220931264
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5520] O-Glycosyl hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	75
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTCTA TTAGTGTAAT TTTAACCGCC AGAGACACCG GAGATAGATT AAGTTTAAAA 
GGTGAAAAAG TATTTAAATC GGGAATAGGG AGACAGGATA TAGACCTGGA ATTATATCCT 
GATACAAGAT ATCAGAAAAT AATCGGTTTT GGTGGGGCAT TTACTGAGGC CGCTGCATAT 
ACACTGTCTA AAATAAGTTC TGATAAGAGA CTTAAAATTA TCGAAAGCTA TTTTGATAGG 
GATAAAGGTC TCGGGTATAA TATGGGGCGT GTTCATATCA ATAGCTGCGA TTTTGCCCTG 
GAGAACTATA CTTATGTAGA AGATGGAGAT AGAGAGTTAA AGACATTTGA TATTTCCCGG 
GAACGGCAAT GGGTGATACC TTTGATCAGG GATGCTATAA AGGCCAGGGG TGGTGAAATA 
AAATTACTGG CCTCACCCTG GAGCCCACCC GCCTGGATGA AGAGCAATGA AAATATGAAT 
TATGGCGGTA AATTGCTGCC TGAATATAGA GATGTCTGGG CTAAATATTA TACTAAATAT 
ATTAAAGCCT TTCAGGAAGA AGGATTAAAT ATCTGGGGAA TTACTGTTCA GAATGAACCT 
GCAGCAGTTC AGACCTGGGA TTCCTGTACA TATACTGCTG AAGAAGAGCG TGATTTTGTT 
AAAAACCACC TCGGCCCGGT TATGCATGAA GAAGGCCTTG GTGACATTAA TATCCTTATC 
TGGGATCATA ATAGAGATAT TATTGTTGAC AGAGTAAAAC CCATTCTGGA TGACCTTGAA 
GCTGCTAAAT ATGTATGGGG GACCGCCTTT CACTGGTATG TGAGTGAAGA CTTTGATAAT 
GTGGGCCAGG TACATGAAAT GTATCCTGAC AAGCATTTGC TTTTTACTGA AGGTTGTCAG 
GAGGGTGGCT GTCAAATTGG CGAATGGTTT ACGGGTGAGA GATATGGGCG TAATATCATC 
GGTGATTTAA ATAACTGGAC TGAAGGGTAT CTGGACTGGA ACATGGTATT GAATGAGGAA 
GGTGGTCCAA ACCATGTGGG CAATTACTGT GATGCCCCGG TAATTGTGGA TACAAATACA 
GAAGAGATAT ATTATAATAG TTCATATTAT TATATTGGCC ATTTCAGTAA ATATATCAGG 
CCTGGTGCTG TCCGGATTGG TGTATCCTGT ACTAATGATA ATTTAAAGGC AACATCTTTC 
CTTAATAGTG ATGGTAGTAT TATACTAATT GTTATGAATG AGACAGATAA TCCCACAGAT 
TTTGCAGTAT CTCTTGATAA TAAGGTAGCT GACCTTACAT TGCCAGCCCA TGCTATTGCA 
ACTTATATCA TTACTTAA

Protein sequence

MNSISVILTA RDTGDRLSLK GEKVFKSGIG RQDIDLELYP DTRYQKIIGF GGAFTEAAAY 
TLSKISSDKR LKIIESYFDR DKGLGYNMGR VHINSCDFAL ENYTYVEDGD RELKTFDISR 
ERQWVIPLIR DAIKARGGEI KLLASPWSPP AWMKSNENMN YGGKLLPEYR DVWAKYYTKY 
IKAFQEEGLN IWGITVQNEP AAVQTWDSCT YTAEEERDFV KNHLGPVMHE EGLGDINILI 
WDHNRDIIVD RVKPILDDLE AAKYVWGTAF HWYVSEDFDN VGQVHEMYPD KHLLFTEGCQ 
EGGCQIGEWF TGERYGRNII GDLNNWTEGY LDWNMVLNEE GGPNHVGNYC DAPVIVDTNT 
EEIYYNSSYY YIGHFSKYIR PGAVRIGVSC TNDNLKATSF LNSDGSIILI VMNETDNPTD 
FAVSLDNKVA DLTLPAHAIA TYIIT