Gene Hore_04270 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_04270
Symbol
ID	7314102
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	458982
End bp	460238
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	43%
IMG OID	643610850
Product	extracellular solute-binding protein family 1
Protein accession	YP_002508180
Protein GI	220931272
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAGT TTGCCGTGAT TGCTGTAGTG GCTCTGCTGG TAGTTTCAAT GTTCAGTCTT 
TCTATAGCTG CCAAGACAAA GATTAAGGTG GCCTGTTTCC CTGATCAGGA CTCTGGCTTT 
GAAGCAATTT TAGATCAATT CCATGCTGAA CATCCTGATA TTGAGGTAGA GCTGGTAGTT 
AATGGTTTTG CCGATCACCA CAACACTCTG CTTACCCAGA TTGCTGCCGG GGCAGAGGTA 
CCTGATGTTG CCATGATTGA AATTGGGTAT ATTGCCAACT TTGTCTCCAA AGGTGGTTTT 
GTAAATCTCC TCGAAGAACC ATATAACGCT GGCCAGTTTA AGGAAAATAT CGTTCCCTAT 
AAATGGGCAC AGGGAAGTAC TGATGACGGC CGCTTAATTG CTTTTCCAAC TGATATTGCA 
CCGGGTACAA TTTATTATCG CAGGGATAAA CTGGCTGAAC TTGGCTATGA AATTGAAGAT 
ATGAAGACTT TAGAAGACTG GATTGAAGCC GGTTCTCAAT TTGCTAAAGA CTTAGATGGT 
GACGGTGTCA ATGATCGCTG GTTACTGGCT GACGCTACTG ATATTTTCTT TATGATTGCT 
AAAAGTGGTG AAGAACTTTA CTTTAATGAA GACGGTGAGT GTATAGTTGA TTCCCCAAGG 
TTTATCAAGG CCTTTAAGGC TGCCAAGATG GTCAGGGATA TGGGACTCGA TGCCAGGATA 
GGTGCCTGGA CCAATGAATG GTATTCTACC TTTAAAGATG GTACAGTCTT AATGCAACCT 
TCAGGAGCAT GGCTTGGTGG CCATATCCGT AACTGGATTG CTCCTGACAC AGCAGGCAAA 
TGGGGTGTAA CCAACCTCCC GGATGGAATG TACTGTAACT GGGGTGGATC CTTTGCAGCT 
ATACCGGAGA AAGCTGAACA TAAGGAAGAA GCCTGGGAAT TTATTAAATT TATTGCCACC 
AGAAAGGATA CCCAGATTGC CCAGTTTAAA GCTTCAAATA TCTTCCCGGC CTGGATGCCT 
GCCTTTGATG ACCCGGTCTT TCAGGAAGAA ATGGAATTCT ATGGTGGACA GAAGGCCCGT 
TTACTCTGGC TTGAAGCAGC CAAGAAGATT CCTAATGTTG TAACCAATAA ATATGATGTT 
ATTGCTGAAG AGATTGTTAC TGCAGCCCTG ACAGATGTAC TTAATAATGA TGCTGATCCT 
GTAGAAGCAC TCAGGGAAGC TAAAAGAATG ATTGAAAGAA GGATGAGAAG AAGGTAA

Protein sequence

MKKFAVIAVV ALLVVSMFSL SIAAKTKIKV ACFPDQDSGF EAILDQFHAE HPDIEVELVV 
NGFADHHNTL LTQIAAGAEV PDVAMIEIGY IANFVSKGGF VNLLEEPYNA GQFKENIVPY 
KWAQGSTDDG RLIAFPTDIA PGTIYYRRDK LAELGYEIED MKTLEDWIEA GSQFAKDLDG 
DGVNDRWLLA DATDIFFMIA KSGEELYFNE DGECIVDSPR FIKAFKAAKM VRDMGLDARI 
GAWTNEWYST FKDGTVLMQP SGAWLGGHIR NWIAPDTAGK WGVTNLPDGM YCNWGGSFAA 
IPEKAEHKEE AWEFIKFIAT RKDTQIAQFK ASNIFPAWMP AFDDPVFQEE MEFYGGQKAR 
LLWLEAAKKI PNVVTNKYDV IAEEIVTAAL TDVLNNDADP VEALREAKRM IERRMRRR