Gene Hhal_2295 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2295
Symbol
ID	4709114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2522796
End bp	2523962
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	69%
IMG OID	639856770
Product	major facilitator transporter
Protein accession	YP_001003860
Protein GI	121999073
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.855468
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCATTG CCCAGCTGCT GATCACCATC TACTGCACGG TCCTGGCCTT CTCGGCCATC 
CATGCCCCGC AGCCGCTGCT ACCGACGCTG CAGGCGGCTT TCTCGGTGAG CGAGCCGAAG 
GCCTCGCTGC TGCTCACCGC TACCCTGCTG CCCCTGGCGG TCGCGCCCAT CGCCTACGGC 
TTCGTCCTCC AGCGCGTCTC CTCGCGGCAG ATGCTGGTGG TGGCCTCGGG GCTACTGGCG 
CTCACCCAGC TAGCGGTGGC CATCGCACCC ACCTTCGAGA TCCTGCTGGG GCTGCGCCTG 
GTACAAGGCC TGCTGATCCC GGCCATCCTC ACCGCCCTGA TGACCTACCT GGCCGCCAGC 
GCCGCGCCGG GGCGGACCAC GCGGGTGATG GCCGGCTATG TAGCGGCCAC GGTCATGGGC 
GGTTTCCTGG GCCGGGCCAT CGCCGGCGCC ATGACCACCG CCGCCAGCTG GGAGGCGGCC 
TTCCTGCTCT TCGGGATCGC CCAGCTGCTC TGCACCGCTC TGTTGCTGCG CCTGGACGCC 
GACCCGCAGG CCGGATTCGG CCGCCTGGAC CGCCGCGCCG TCGGCCAGAT CCTGCGCCAG 
CCGCGGGCCC TACGGGTCTA CGGCGCCATC TTCTGCGCCT TCTTCGTCTT CCTCTCGCTG 
CTCACCTTCC TGCCCTTCCG TCTGGTGGAG TTGGAAACCG GACTGAGCGA TCTGGGCATC 
TCGCTGATGT ACACCGGTTA CCTGATGGGT GTGGTCACCG CGCTCAGCGC CCTGCGCGTG 
GCTGATCGCA TCGGCGGCGT GGTCAACACC ATGCTGTTGG GCATCGCCAT CTTTGCTGCC 
TCGCTGGCGA TGTTCCTCGG CCCCTGGCTG GCGGTGATCT TCGTCGGGAT GTTCGTCTTC 
TGCGCCGGGA TGTTCCTGCT CCACGCCCTG GCGCCCGGGT TCCTGAACCA GGAGGTGGAC 
GGCGATATCG GCGTGGTCAA CGGCCTCTAC ATCGCCTTCT ACTACGCCGG CGGCGCGGTG 
GGCTCCTGGC TACCGGGCTA CCTCTACCAC GGCCTGGGCT GGGAGGCCTA CGTGGCCTCC 
CTGGCGGCCA TGCTCGGCCT GGCCGGGTAC TGGATCTGGG GGCTGCGGTC CGCCCCACGC 
GCTGAACGGG GCACCTACTC CGGCTGA

Protein sequence

MPIAQLLITI YCTVLAFSAI HAPQPLLPTL QAAFSVSEPK ASLLLTATLL PLAVAPIAYG 
FVLQRVSSRQ MLVVASGLLA LTQLAVAIAP TFEILLGLRL VQGLLIPAIL TALMTYLAAS 
AAPGRTTRVM AGYVAATVMG GFLGRAIAGA MTTAASWEAA FLLFGIAQLL CTALLLRLDA 
DPQAGFGRLD RRAVGQILRQ PRALRVYGAI FCAFFVFLSL LTFLPFRLVE LETGLSDLGI 
SLMYTGYLMG VVTALSALRV ADRIGGVVNT MLLGIAIFAA SLAMFLGPWL AVIFVGMFVF 
CAGMFLLHAL APGFLNQEVD GDIGVVNGLY IAFYYAGGAV GSWLPGYLYH GLGWEAYVAS 
LAAMLGLAGY WIWGLRSAPR AERGTYSG