Gene Hore_21930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_21930
Symbol
ID	7313741
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2384081
End bp	2385379
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	33%
IMG OID	643612646
Product	major facilitator superfamily MFS_1
Protein accession	YP_002509934
Protein GI	220933026
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	79
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAATACAC AAAAAGGTTT GGAAAAAACA CTACCCGAAA AAGAAATGAA AAAATCAGTA 
AAAAAGAATA TTATGTTTTT ATTAATGGGG AAATTCGTTT CTGTACTGGG TAGTCAAATT 
TATTCTTTTG CAATCAGCCT CTATGTTTTA TCAATAACTG GTTCGGGTCT TAGTTTTTCT 
CTTACCCTGG CACTTTCTAC CTTACCCAGG GTTATTTTTG GTCCCATTTC GGGGGTAATA 
GCTGACAGGG TTGATAGAAA GAAAATGGTA GTAGCAATGG ATATTATTAG TGGATTAGTG 
GTAATTGGAT TATTTTCCCT AAGTATAATT GATGAACTCA GGTTAGTCTA TATTTATTCA 
ACTACATTTT TGCTTTCTAC GTGTAGTATC TTTTTTAACA CCCCCTTAAC TGCATCCCTG 
CCAAACATTG TGGATGATGA AAATCTTACA AGGATCAATT CATTGAGTCA AACTATAGAA 
TCTATATCGT CAATTGCCGG ACCTTTTATT GGCGGTATTG TTTATGCAAT TATGGATATT 
AAAACATTTT TAGTTATTAA TGGAATATCT TTTATAATCT CAGGGATATC AGAATTATTT 
ATAGATTTCA AATTGAATAG TCGTGGAAGA GTTCTTGAAG AAAGTAATAT GGAGAAAGAA 
AAGGTATCCT TTTTTGTTGA TTTAAAGGAA GGCATAAGAT ATATAGCTAG TCAGAAATGG 
CTTATTGTCC TCAGTTCATT TTTTGTAATA TTAAATATGT TGGTCATGAT GGGTTTACTG 
GTACCAGTTC CCTATATTGT AAGGGAAATC TGGGGATTTA CCTCCCAACA ATATGGTTAT 
TTAAATTCAA TGTTTCCGAT GGGAATATTA GTTGGCTCTC TTTTGCTGGC TATTTTGCCG 
CAAAAGGGAA AGAAATTTAA AAGGTTTATG TTTTTTACTA TGGTTTTTTC AATTGCTGTT 
ATTTCAGTTG GTATAATTAC TTCAGAGATG ATTTTTGAAC TGAACAACCT GCAGTATTTG 
TTTATTTTAA TGGGTTTATA CTTTATTATA TCAGTATCTG CCATATTTAT TAATGTCCCC 
CTTGAAGTGA CATTACAACG GCTTGTACCA GATGATAAAC GTGGTAGGGT TGAGGGGAGT 
TTAGGGTCCC TATCTGAGGC TTTATCGCCA ATAGGTGTTA TAGTTGCTGG TGTACTTGTT 
GACTTAATAT CTCCCTGGAT TTTACCTATC ACTTGTGGAA TTATAATGTT GGTTTTGTCT 
ATAGCAATGG GGAGGGTAAA AGTTGTTAAG GAAATCTAA

Protein sequence

MNTQKGLEKT LPEKEMKKSV KKNIMFLLMG KFVSVLGSQI YSFAISLYVL SITGSGLSFS 
LTLALSTLPR VIFGPISGVI ADRVDRKKMV VAMDIISGLV VIGLFSLSII DELRLVYIYS 
TTFLLSTCSI FFNTPLTASL PNIVDDENLT RINSLSQTIE SISSIAGPFI GGIVYAIMDI 
KTFLVINGIS FIISGISELF IDFKLNSRGR VLEESNMEKE KVSFFVDLKE GIRYIASQKW 
LIVLSSFFVI LNMLVMMGLL VPVPYIVREI WGFTSQQYGY LNSMFPMGIL VGSLLLAILP 
QKGKKFKRFM FFTMVFSIAV ISVGIITSEM IFELNNLQYL FILMGLYFII SVSAIFINVP 
LEVTLQRLVP DDKRGRVEGS LGSLSEALSP IGVIVAGVLV DLISPWILPI TCGIIMLVLS 
IAMGRVKVVK EI