Gene Hore_20090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_20090
Symbol
ID	7314333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2165814
End bp	2166995
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	41%
IMG OID	643612455
Product	permease
Protein accession	YP_002509751
Protein GI	220932843
COG category	[R] General function prediction only
COG ID	[COG0701] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATAAATT TGACCAGACT AAAAAAATTT ATATTATATG TCACCATATT TATGATGGCT 
TATTTTGTTC CATTTCATAA TTTAAAAATT CAGGAGGCAA TAGTCGAGTC CTTTTTAATG 
CTACAGGAAT ATGCCAGGGA ACATGTTCTT TTTTGTTTGA TACCCGCATT TTTTATTGCC 
GGTGCTATTG CCAATTTTAT TTCACAACAG GCCGTAATTA AATACTTCGG AAGCCAGGCT 
AAAAAATGGG TTTCATATAC AGTAGCTTCT GTATCAGGTG CCATTCTGGC TGTCTGTTCC 
TGTACTGTTT TACCCCTTTT TGCCGGTATT TATAAGAGGG GAGCCGGGAT TGGTCCAGCT 
ACGGCCTTCC TGTATTCAGG TCCAGCCATT AATGTTCTGG CTATAATTCT GACAGCCAGG 
ATACTGGGGT GGCAGATGGG GCTGGCCAGG GCTATTGGTG CAGTTATCTT TGCTCTGGTG 
ATTGGCTTAC TGATGGCAGT AATCTTCCGT AAAGAAGATA AAGAGAGGCT TGAAGGAGTA 
ATGGGTAAAA ATACTGAGGG TGTTGCGGGT AGAACTGGTC TTCAGAACTT AATATATTTT 
ATGACCCTGG TCTTAATTTT AATTTTTGCC GCCTGGGGTA AACCCCAACA GGCAACAGGT 
TTCTGGGTGA AAATATTTAA TATTAAATGG ATAATTACTA TTACTTTACT AATAATAATG 
GTAATCATCT TAAAGAGCTG GTTTACTAAG GGAGAACTTA AAGACTGGAT AGATTCTACC 
TGGGATTTTG CTGCCCAGAT ATTACCCCTG TTGTTTGCCG GGGTTCTAAT AGCCGGTTTT 
TTAATGGGAC GTCCCGGTAC CGATGCTGGT ATTATTCCGC CAGACTGGGT TACCAGGTTT 
GTGGGAGGTA ATTCTATTTT AGCAAATTTC ACGGCATCGA TTCTGGGAGC ATTTATGTAT 
TTTGCTACCC TGACTGAAGT ACCTATTTTA CAGGGACTTC TTGGTCTGGG AATGGGTAAA 
GGACCAGCCC TGGCCCTTTT ACTTGCCGGA CCGGCTTTAA GTCTACCCAA TATGCTTGTT 
ATTCGCAGTG TTATGGGAAC TAAAAAGACA CTTGTTTTTA TAGGTTTAGT TGTAGCTATG 
GCTACAATCA GTGGACTAAT TTATGGTGCC ATAGTAGTTT AA

Protein sequence

MINLTRLKKF ILYVTIFMMA YFVPFHNLKI QEAIVESFLM LQEYAREHVL FCLIPAFFIA 
GAIANFISQQ AVIKYFGSQA KKWVSYTVAS VSGAILAVCS CTVLPLFAGI YKRGAGIGPA 
TAFLYSGPAI NVLAIILTAR ILGWQMGLAR AIGAVIFALV IGLLMAVIFR KEDKERLEGV 
MGKNTEGVAG RTGLQNLIYF MTLVLILIFA AWGKPQQATG FWVKIFNIKW IITITLLIIM 
VIILKSWFTK GELKDWIDST WDFAAQILPL LFAGVLIAGF LMGRPGTDAG IIPPDWVTRF 
VGGNSILANF TASILGAFMY FATLTEVPIL QGLLGLGMGK GPALALLLAG PALSLPNMLV 
IRSVMGTKKT LVFIGLVVAM ATISGLIYGA IVV