Gene Hore_19900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_19900
Symbol
ID	7312805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2146115
End bp	2147362
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	42%
IMG OID	643612436
Product	extracellular solute-binding protein family 1
Protein accession	YP_002509732
Protein GI	220932824
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	65
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGAGGT TCCTTGTGGT AACTGTAGTA GTCCTGTCGG TTATGTTAAT AAGTGGTGCT 
GCCCTGGCGG AAGAGTTAAA TGTCCTTTAT ATGGCCCAGG CAGGATATCA GCCTGAAGAA 
GTCAGGCAGA TGGCAGATGT TTTTGAAGAA ATTGTCGGGG TTGAGGTAAA TATTACTTTT 
GTAAAGTATG ATGAAATGCA CGATAAAATT GTAACTTCAG CTGCTGTACC TGTCGGGACT 
TATGATGTTG TACTGGAAGA TCTGATCTGG ACAGCTGAAT TTGCAGAATA TGGATTTGTA 
GAGCCCATTG ATGACCGTGT TAATGATCGA ATTTTAAATG ATATACCTAA AGCTATCCTC 
GATGCATTTC GCTATAATGG TAAGCTCTGG GCCATGCCCT ACCTGGCTAA CTTCCAGTTA 
TTTTTCTACA ATGAAGACAT GATTAAAAAA GCAGGATTTG ATGGACCTCC CAAAACCCTG 
GAAGAAATGG TTGAACAGAT GAGGGTTATG AAGGAAAAGG GTATTGTGGA GTATCCCTTG 
GTTGATTCCT GGAACCAGAA AGAAGGTCTG GTCTGTGAGT ATGTCTGGTT AACCGGGGCT 
TTTGGTGGAG ACACTTTTGA TGAAAATGGT AACCCCGTTT TTAACCGGGG ACCGGGACTT 
GAGGCTCTTA AATTTATGAA GATGCTTCTG GATGAAGGAC TTGCTAATCC CCAGTCTTTA 
ACACTTAATG AAAATATGGC TAAAGATGTC TTTATTGCCG GAGATGCTGC TTTTACTACC 
AACTGGACCT TCCAGTATGG TGCCATGAAA GATCCTGAAC AGTCACAGGT AGTAGACTCA 
GGTAAAATGG GACTGATTCC GGTGGCTGAA GATGTCCTCG GTAAGTATAA GTATAATACA 
GCATCAGTAT CCGGATTCCA GGGAGCAGCT ATAATGGCTA ACTCTGAACA TAAGGATCTG 
GCCTGGAAAT ATATCCGTTT TATTACCAGT CCTGTTGTTC AGCGTGGTTA CCTGGTAGAA 
ATGCCTGTCT GGAAATCTGT CCAAAATAGT GCCTATGCCC AGTCTAACTT CCCGACCATC 
AAGATAAAAG CTAAAGAAAT TGCCAGTGTT CATCACAGGC CTCGTGTTCC CAACTATCAG 
GAGGTATCTT CCATATTACA GAGATATATT CACCAGTGCC TGGAAGGTAA ATATGAACCT 
GAAGAAGCCC TTGATGCTGC TGTAAAGGAA ATTAAAAACC TGAAATAG

Protein sequence

MKRFLVVTVV VLSVMLISGA ALAEELNVLY MAQAGYQPEE VRQMADVFEE IVGVEVNITF 
VKYDEMHDKI VTSAAVPVGT YDVVLEDLIW TAEFAEYGFV EPIDDRVNDR ILNDIPKAIL 
DAFRYNGKLW AMPYLANFQL FFYNEDMIKK AGFDGPPKTL EEMVEQMRVM KEKGIVEYPL 
VDSWNQKEGL VCEYVWLTGA FGGDTFDENG NPVFNRGPGL EALKFMKMLL DEGLANPQSL 
TLNENMAKDV FIAGDAAFTT NWTFQYGAMK DPEQSQVVDS GKMGLIPVAE DVLGKYKYNT 
ASVSGFQGAA IMANSEHKDL AWKYIRFITS PVVQRGYLVE MPVWKSVQNS AYAQSNFPTI 
KIKAKEIASV HHRPRVPNYQ EVSSILQRYI HQCLEGKYEP EEALDAAVKE IKNLK