Gene Hore_00380 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_00380
Symbol
ID	7314255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	42408
End bp	43676
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	42%
IMG OID	643610455
Product	extracellular solute-binding protein family 1
Protein accession	YP_002507794
Protein GI	220930886
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAATA AATCTTTAAT TGTTTTACTG GTAGTAAGCC TGTTACTGGT TTGTTATGGG 
ACAGGATTGG CTAAAACCAC TGTCAGGATT GCTGGCTTTG GGGGGAATGA CCAGGTAATT 
GTTGAGGAGC TCCTTAATAA ATTTGTCAGG CCAGAGCTGG CGGATGAAGG TATTGAAATT 
ATTTACGAGC CTATTGCTGA TGATTATCAA AGGTACCTTT TGAATTCGCT TTCTGCCGGT 
ACTGCTGCAG ACCTGTTTTA TATGGATATT TTCTGGGCTA AAAATGTTAT AAAAGAAGGT 
CTGGTTGAAC CGCTTGATAG CTATCTGGCT AAATCTGAAG TTATCAGCAA AGAAGACATT 
GTGCCCAGCT TACTAGAAGG TTTTACCTAT GAAGGCAAAT TGTATGGAAT CCCCAAGGAT 
TTCAACTCTC TGGCCCTGTT TTACAATAAG GACCTTTTTG ATATAGCAGG AATACCTTAT 
CCCAATGAGG CCGATACCTG GAAAACCTTA GAATATAAAT TAAGGAAAGT GGTTGAGTTT 
TTTGAAAAAG AAGGAGAAGA AATTCATGGA TTGGCATTAC AACCTGAGTA TGCCAGGATG 
GGTGCCTTTG CTTATGCTGC TGGATGGGAA CCTTTTGTAA ATGGAAAAAC AAATCTCCAG 
GACCCCAAAT TTGTCAAAGC ATTTAAATGG TATACCGGAT TAAAAGAAAA AGGGTTAGGT 
ATTATGCCGG CTGATATTGG CCAGGGCTGG GGCGGTGGCG CCTTTGCTAA TGGTAATTTT 
GCTGCCTGCC TCGAAGGAGC CTGGATTATT GGATTCCTGC GTGATCAGGC ACCAAACCTG 
AATTATGGTG CTACCTTGCT ACCGAAATGC TCAGATACCG ATGAAAGAGG TAACTTTATC 
TTCACTGTTG CCTGGGGTAT AAATGCTAAC TCAAAGAATA AAGAAGCCGC TTTCAGGGTT 
TTAGAAACAC TGACAAGTCC TGAAGCCCAG CAATGGGTTC TGGAAAGGGG TCTTGCCATT 
CCCAGCCGGA AATCACTGGC TGACAATCCG TACTTTGAAA AGCAGACCAA GGAAGCCCAG 
GCCAATAAAG TTGTCTTCAT GGGTGCGTCA AGAGGAAATA TTAAACCCTA TAGTTTCAGG 
GATTATGGTG GAGAATGGAT GGAACCAATC AATACTGCTT TAAATGAAGT AATGAGTGGA 
CAGTCAACAG TAGAAGAAGC ATTAAAAACT GCCCAGGAAA GACTTGAACA GGACATAATG 
AATAAATAA

Protein sequence

MRNKSLIVLL VVSLLLVCYG TGLAKTTVRI AGFGGNDQVI VEELLNKFVR PELADEGIEI 
IYEPIADDYQ RYLLNSLSAG TAADLFYMDI FWAKNVIKEG LVEPLDSYLA KSEVISKEDI 
VPSLLEGFTY EGKLYGIPKD FNSLALFYNK DLFDIAGIPY PNEADTWKTL EYKLRKVVEF 
FEKEGEEIHG LALQPEYARM GAFAYAAGWE PFVNGKTNLQ DPKFVKAFKW YTGLKEKGLG 
IMPADIGQGW GGGAFANGNF AACLEGAWII GFLRDQAPNL NYGATLLPKC SDTDERGNFI 
FTVAWGINAN SKNKEAAFRV LETLTSPEAQ QWVLERGLAI PSRKSLADNP YFEKQTKEAQ 
ANKVVFMGAS RGNIKPYSFR DYGGEWMEPI NTALNEVMSG QSTVEEALKT AQERLEQDIM 
NK