Gene Hore_13200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_13200
Symbol
ID	7314106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	1418635
End bp	1419909
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	42%
IMG OID	643611760
Product	extracellular solute-binding protein family 1
Protein accession	YP_002509065
Protein GI	220932157
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAAAA AGGGCTTATG CTTGGTACTT AATTTGCTTA TTATTGTATT TGCTTTTACA 
GGTGTTTCAG TTGCTGATAA TGGTAGTTTA ACCGTAATGG CCCAGTGGGG TGGTCAGGAA 
CTTGATGCCT TTATGAAAGT TATTGAAAGG TTTGAGGAGA AAACTGGTAT TGACGTTAAA 
TATGAAAGCA CCCGTGATAC TTCCACTGTA CTGGTTACCA GAATCCAGGC AGGAAACCCG 
CCTGAAGTAT GTGTTATCCC TGACCTTGGT TTGATTAAAG ACCTTGGTCA AGAAGGGAGT 
TTAGTTGATC TGAATAAGGT TCTGGATATG GACAGGATTA AAGAAGAATA TAACGATGTC 
TGGCTTGACT TAACTACTGT AGATGGCCAC ATGTATGGTC TGGTAATGAC CGCCGATATT 
AAAAGTCTTA TCTGGTATAA TCCTAAAGCC TTTAAAGCCA GGGGGTATGA GGTCCCTGGA 
ACCCTGGATG AACTGATGAG TTTAACTGAG AGAATGGCCA GAAAGGGAGA TATTCCCTGG 
GCTGTAGGAT TAGAATCTGG TCCGGCCAGT GGCTGGCCAG GTACTGACTG GATTGAGGAT 
CTTGTCTTAA GGTTGGCAGG CCCTGAAGTA TTTGATAAAT GGATTAACCA TGAGATCCCC 
TGGACAGATC CAAGAATAAA AGAGGCCTTT GAGTACTTCG GAAAAATCGT TAAAAACTCA 
AAATATGTCT GGGGTGGACC AACCAGTGTC CTAATGACTA ATTTTGGCGA TGCTGTAGCC 
CCACTTTATA CTGAACCTCC ACAGGCTTTT ATGCATAAAC AGGCTAGCTT TATTACCAGT 
TTCATATTGG AACATAATCC TGACCTTGTG GCCGGTGAAG ATTATGATTT CTTCCCCTTC 
CCACCGGCTG AAAAAGGAGA GGGGGTACCT GTCCTCGGGG CTGCTGATAT GGTAAGTATG 
CTTAAAGATA CCCCTGAAGC CAGGAAGTTT GTAGACTTTT TATCAACACC TGAAGCCCAG 
ACAATCTTTA TCAAAGAACT GGGTAAAATC GGTGTAAACA AAACAATAGA CCTGGCAGTA 
TACCCTGATA AGATTACCAG GAAGATGGCC AGAACTCTGT TAAATGCCTC TGTTTTCAGG 
TTTGATGGTT CTAATTCAAT GCCGGCAGCT GTAGGTTCTG GTGCTTTTAA CCCGGGTATC 
CTGGATTATG TTAGGGGAAA AGACTTAGAT GATGTCTTAA AATCTATTGA AGCTGTAGCT 
GAAGAAAACT ATTAA

Protein sequence

MTKKGLCLVL NLLIIVFAFT GVSVADNGSL TVMAQWGGQE LDAFMKVIER FEEKTGIDVK 
YESTRDTSTV LVTRIQAGNP PEVCVIPDLG LIKDLGQEGS LVDLNKVLDM DRIKEEYNDV 
WLDLTTVDGH MYGLVMTADI KSLIWYNPKA FKARGYEVPG TLDELMSLTE RMARKGDIPW 
AVGLESGPAS GWPGTDWIED LVLRLAGPEV FDKWINHEIP WTDPRIKEAF EYFGKIVKNS 
KYVWGGPTSV LMTNFGDAVA PLYTEPPQAF MHKQASFITS FILEHNPDLV AGEDYDFFPF 
PPAEKGEGVP VLGAADMVSM LKDTPEARKF VDFLSTPEAQ TIFIKELGKI GVNKTIDLAV 
YPDKITRKMA RTLLNASVFR FDGSNSMPAA VGSGAFNPGI LDYVRGKDLD DVLKSIEAVA 
EENY