Gene Hore_20630 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_20630
Symbol
ID	7314387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2231247
End bp	2232491
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	38%
IMG OID	643612507
Product	extracellular solute-binding protein family 1
Protein accession	YP_002509803
Protein GI	220932895
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	62
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAAAA ATAATTTAGT TAAAGTAATT TCGGTAATTG TTTTGATTTT ATCTCTCAGT 
ACAGTAGCTA TGGCAAAGCA GGTAGAATTA ACATTCTGGA ATGGATTTAC GGGACCGGAC 
AGGGTTCAGG TTGAAGGCCT GGTAAAAGAA TTTAATGAAA CACACCCTGA TATAAACATA 
AAAATGGAAA TCATGCCCTG GGATAGCTTT TTTCAGAAAT TATTGCCTTC CCTGGCAGTA 
GGAAAAGGAC CTGATATTGC TGCTTTTGAT ACTTCTTATA TTCCGCGGTA TGCAGAGTCA 
GGCGTTATTG CTCCTATTGA TGACTTATAT GAAGGGTATA TTGATAAAGA CACCCTGATA 
CCGGCTATGT ATAATAACCT TAAATGGAAG GGTAAAACCT ACGGATCACC AATGAATTAC 
ACAAGTTTAC TTCTTTATTA CAACAAGGAT ATGTTCAAAG AAGCCGGGCT TGATCCCAAT 
AATCCTCCAA GAACCTGGAA AGAATTAAAA GAATATGCCC TGAAGCTTAC AAAAGATACT 
AATAATGATG GTAAAGTAGA CCAGTATGGT TTTGTAATTG CTGCAAAGCA GACTATTCCC 
ATGTGGCCTA TAGTTATCTG GGGGAATGGT GGTCGGATAA TCAAAGATGG AGAGGTTTTT 
ATAAATAAAC CGAAAGCTGT GGAAGCGGTA GAAAGCATGG CCAGTCTTAT TAAAGAAGAC 
GGTATTTCGC CCATTGGGTT GACGGGGGCT GAATGTGATA AATTATTTGA AACCCAGAGG 
GCAGCTATGT ATTTCTGTGG TCCCTGGATG GTAAATGGTT TTAAAAATGC TGGCATAAAT 
TTCGGTGTGG CCCAGGTACC TGCCAGGGAA GATGGCAGGA GAATAACCCT CGGTACCAGT 
GTAGCCATGG TACTAAACAA AGCTAGCCTG GATAAGAAAG AAGCTGCCTA TGAATTCTTT 
AAATTCTGGA ATTCTAAAAA GTCACAAATT TACTGGTCTC TAGGATCTGG TTTCCCCCCA 
ACCAGGATAG ATATTACAGA AGAAAAATTG GCTCAAAATC CGTTTGTAGT TGAATTTTCT 
AGAGCTGCCA GAGACTCAAG GTTTTATTTG CCTAAATTAG AGAATTTCAA CAAAATTAAT 
TCAGATGTTA TTGTTCCTGC CCTTGAAAAG GTCCTATATG ATAAAGCTAC AGCTGAGGAA 
GCCCTAGACG AAGCAGCATT TATAATTAAA AGAATTATAG ATTAA

Protein sequence

MTKNNLVKVI SVIVLILSLS TVAMAKQVEL TFWNGFTGPD RVQVEGLVKE FNETHPDINI 
KMEIMPWDSF FQKLLPSLAV GKGPDIAAFD TSYIPRYAES GVIAPIDDLY EGYIDKDTLI 
PAMYNNLKWK GKTYGSPMNY TSLLLYYNKD MFKEAGLDPN NPPRTWKELK EYALKLTKDT 
NNDGKVDQYG FVIAAKQTIP MWPIVIWGNG GRIIKDGEVF INKPKAVEAV ESMASLIKED 
GISPIGLTGA ECDKLFETQR AAMYFCGPWM VNGFKNAGIN FGVAQVPARE DGRRITLGTS 
VAMVLNKASL DKKEAAYEFF KFWNSKKSQI YWSLGSGFPP TRIDITEEKL AQNPFVVEFS 
RAARDSRFYL PKLENFNKIN SDVIVPALEK VLYDKATAEE ALDEAAFIIK RIID