Gene Hhal_2014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2014
Symbol
ID	4710291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2217420
End bp	2218700
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	69%
IMG OID	639856487
Product	major facilitator transporter
Protein accession	YP_001003580
Protein GI	121998793
COG category	[R] General function prediction only
COG ID	[COG2270] Permeases of the major facilitator superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.273868
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCGATT TCGCCAACCA GGCCTACACC CTGCTGATCA TCACCGTCAT CTACGGCGAT 
CTGTTCACCC GGGTCATCGT CGGCGACGCC GGTGACGACT ACCGCCTGGG CAACCTGCTC 
TGGAGCACGG CCCTGGCGCT GAGCTACCTG GGGGTGGTGG CCACCGCCCC GGTGTTCGGT 
GCGGTCATGG ACTACGCGGC GGCCAAGCGT CGCTTCCTGT TCCTGAGCTA CGTCACCACG 
GTGGCCGCCA CCGCCGCGCT CTACTGGGTG GAGCCCGGCT ACGTGGTGCT CGGCTTCGTG 
CTGATTGTCC TCTCCAGCTA CGCCTACTCC ATGGGCGAGG CGTTCATCGC CGGTTTCCTG 
CCGGATATCG CCGGGCCGCA GGAGATGGGG CGGGTCTCCG GGTTGGGCTG GTCCTTGGGC 
TACCTCGGTG GGCTGTTCGC CACCGCGTTC ACGGTGCTGC TGCTCGGTGA GGTCAGCAAG 
GAGAACTTCG ACCGCATCCG CTGGGTGGGC CCCTTTGCTG CCGCCTTTTT CCTGCTCTGT 
GCCATCCCCA CCTTCCTGTG GCTGCGCGAG CGCGGGCAGC CCCGGCGCCT GCCGGCCGGA 
CAGGGCTACG TTCGCCTCGG TATCCAGCGG GTGGGGCAGA CCGTGCGCAG CCTCGGTTAT 
CTGCGTGACC TGGGGGTGTT CATGATCTCG CTGCTGATGG CCATGTCGGG GCTGGCCATC 
GTCATCGCCT ACGCCTTCAT CTACGGTGCA CAGGTCATCG GCTGGGATGA GCGGGCGCGC 
CTGATCATGT TCGTGGTCAC CCAGTTCTCC GCGGCGGCCG GCGCCATCGG CTTCGGGGTG 
ATCCAGGACC GCTTCGGTGC CCTGCGCACC TACATGGTGA CCCTGGTGAT GTGGGTAGCG 
GCGATCCTGC TGATCTGGGT GACCCCGGAG CTGACCGAGT GGCTCAATCG TTGGCTGGGC 
ACGGAGTGGC AGGCGCAGTA CGTCTTCCTG ACCGCCGGGG TGGCCGCGGG GCTGGCCCTG 
GGGTCGTGCC AGTCGGCCGG GCGGACGCTG GTGGGGCTGT TCGCTCCGCC GGGACGTGCG 
GCGGAGTTCT TCGGGTTCTG GGGGCTGGCG ACCAAGCTGG CTGCCGCCTT CGGCCTGGTG 
GCAGTGGGGG CGCTGCAGGC GGCCGTGGGT CTGCAGTCGG CGATCCTGCT CTGCGCCGTG 
CTGTTTGCCG GCGCGCTGGT GGTGGCCTGG GGGGTCGACG AGGCGCGGGG TCGGGCGCGC 
GGGCAGGCTT TGGTAGAGTG A

Protein sequence

MFDFANQAYT LLIITVIYGD LFTRVIVGDA GDDYRLGNLL WSTALALSYL GVVATAPVFG 
AVMDYAAAKR RFLFLSYVTT VAATAALYWV EPGYVVLGFV LIVLSSYAYS MGEAFIAGFL 
PDIAGPQEMG RVSGLGWSLG YLGGLFATAF TVLLLGEVSK ENFDRIRWVG PFAAAFFLLC 
AIPTFLWLRE RGQPRRLPAG QGYVRLGIQR VGQTVRSLGY LRDLGVFMIS LLMAMSGLAI 
VIAYAFIYGA QVIGWDERAR LIMFVVTQFS AAAGAIGFGV IQDRFGALRT YMVTLVMWVA 
AILLIWVTPE LTEWLNRWLG TEWQAQYVFL TAGVAAGLAL GSCQSAGRTL VGLFAPPGRA 
AEFFGFWGLA TKLAAAFGLV AVGALQAAVG LQSAILLCAV LFAGALVVAW GVDEARGRAR 
GQALVE