Gene Hore_05410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_05410
Symbol
ID	7313505
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	587398
End bp	589026
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	38%
IMG OID	643610964
Product	Sodium:solute symporter
Protein accession	YP_002508294
Protein GI	220931386
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0000000184365
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATGGT ACTATCTTAT TCCGTTAGTC TATTTATTTT TACTACTGGT TGTTGGTTTT 
GTTATAGCTA AAAGACAGGA AACCCGGTCA GATTTTTATG TTGCCTCAAA TAAAATGGAT 
GGATCAGTCC TCTTTGCTAC AGTTATGTCC ACAGTGGTTG GCGCAAATAC ATATATGGGT 
TTTAGTGGCT TGATTTATAA TGGTGGACTT CATTTTATGT GGATGCTCAG TGGTGCCGGT 
CTTGCTTATT TTATCCTCTT CTTTATATCA GGTAAAATAA GGAAAATAGC CACAAAATAC 
GAAGTATTCA CTCTTCCTGA CCTGGTAGAG CTTAGATATT CTAATCCTGT TGCCCTACTA 
ACTACTTTCT TTTCCCTTAT TGGGCTAGTT GGAGGTATCG GAGGTGGTCT TCTCGGTTTA 
GGAGTTATAC TTAATTCTTT ACTGGGAATA CCCACCACTA CTGCTATAAT TGTTACTTCC 
ATTATTACTA TCATTTATAC CTGTCTTGGA GGTTTATGGG GAGTATCCCT GACAGACTGG 
ATTCAATCTA TTATTATGAT TGCTGGTGTA GCAGTCTGTA TAGTATTTGG GATAACCTCT 
GTAACACCGG GACAATCATT TGTCAATGGT GCCTTCGAAA TAGTAAATGT ATTAAAACAA 
CAATTAGGAA CAGAACTGGT TAGCCCCTTT GCCGGTTTAA CCTTTTTTAT GGCTCTGGCC 
TGGACCATTA CCTTTATGCC CCTTAATACT ATCTCTCAGA CCCAGATCCA GAGGGTTTAT 
GCAGCAAAAA ATGTAAAGAC TATTCGTGGT GTCAGTTTAC TAATGATTAT TTTTGTAGCT 
ATGGTCCTCA CTTTCGGTTT AGCCTTTATC GGAATTCTTG GAAGAGTTGC TTTACCCGGT 
TTAAAAAATG CTGAGGCAGT CTTCCCCCAG ATGAGCATGA AAGTTATCAA CCCTGCATTA 
GGTATTTTAA TTGTAACGGG AATTATGGGA GCTGCTATGT CTACAGTAGA TTCAAACCTT 
CTCGGTTCCG CCATGCATGT CACCCGTGAC CTATATGAAC GGTACATGAG ATATAAGAAT 
AAGTCTGTTG ATGAAAAGCG TATTTTATTT ATCAGTCGGG TAACCATTGT TATTATTGGT 
GTAATTAGTA CTATAGCTGC TCTATTCACT CCTTCTATAA TGAGCCTACT ACTGATAACA 
ATGAAGATAT TTGCCGGAGC TACTTTTGCC CCTGTACTTA TCGGTCTTTA CTGGAAAAGA 
GCCAATGCTT TCGGGGCTTT ACTGGGTGAA ATTCTTGGAG GTATGGCTGT TGTTATTAAT 
ATTATTCACC CCGTTGTCAA CCTGGATCCT GTCATATTTG GAATTATTAT GGCAGTTTTA 
GGAACGATAA CTGGCAGCTT ATTTACCAAA GAAAATACAG AAAAAGGCAG TATTTTTTCT 
TTTGCTAATG ATATTTCATC AAAAGGATGG CTCGCAGTTA TAGCTATTGC TCTTCTCTAT 
TTTGGATGGG TTATAAGTAT GAACAACTAC GCCATGTGGC CGTATTTCAT TATAACTACT 
GTAGTATTAC TGGTTTTATC AGTTGTCTTC CTTATTTATA GTTTTATCAC TGAAAGAACC 
GGCAATTAA

Protein sequence

MEWYYLIPLV YLFLLLVVGF VIAKRQETRS DFYVASNKMD GSVLFATVMS TVVGANTYMG 
FSGLIYNGGL HFMWMLSGAG LAYFILFFIS GKIRKIATKY EVFTLPDLVE LRYSNPVALL 
TTFFSLIGLV GGIGGGLLGL GVILNSLLGI PTTTAIIVTS IITIIYTCLG GLWGVSLTDW 
IQSIIMIAGV AVCIVFGITS VTPGQSFVNG AFEIVNVLKQ QLGTELVSPF AGLTFFMALA 
WTITFMPLNT ISQTQIQRVY AAKNVKTIRG VSLLMIIFVA MVLTFGLAFI GILGRVALPG 
LKNAEAVFPQ MSMKVINPAL GILIVTGIMG AAMSTVDSNL LGSAMHVTRD LYERYMRYKN 
KSVDEKRILF ISRVTIVIIG VISTIAALFT PSIMSLLLIT MKIFAGATFA PVLIGLYWKR 
ANAFGALLGE ILGGMAVVIN IIHPVVNLDP VIFGIIMAVL GTITGSLFTK ENTEKGSIFS 
FANDISSKGW LAVIAIALLY FGWVISMNNY AMWPYFIITT VVLLVLSVVF LIYSFITERT 
GN