Gene Hhal_0393 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0393
Symbol
ID	4711409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	458195
End bp	459460
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	68%
IMG OID	639854856
Product	major facilitator transporter
Protein accession	YP_001001989
Protein GI	121997202
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.464327
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAGCTG TCAATGCCAC CGGTTTCGCC ATCCTCGGCG CGGGGCTCAT CGCCATCGCC 
TACGGGCTTG CGCGTTATGC GTACGGGTTG TTCGTCCCGT CGATTCGCTC GGAGCTCGGG 
TTGTCCGCCG ACGCGGTCGG GGTCGTCGGA TCCATGGCCT TTATCAGCTT CTGCCTGGCC 
AGCGTCGTGG CGCCACTGAT TGTCGACCGG CTCGGCGCAC GCTACTCGGC GGTGCTCTCC 
GGTCTGTTTG CTTTGGCCGG GCTGACCCTG ATCAGCCAGG CCGGTGACGC GATCACCCTC 
GGCGCCGGGG TGTTTGCCTG CGGGATCTGT ACCGGCCTGA TGATGCCGGC CCTGTCCTCC 
GGCGTGCAGA CGAACATTCG TCCGGACCTC CGCGGCCGCG TCAACGCCGT CATGAATGCC 
GGTACCAGTG CCGGCCTGAT CCTCTGCGTG CCCGCCGTGC TTCTGCTCAG CGGCGCGTGG 
CGTATGGCCT ACGGCTCTTT CGCGGTGCTC GCGGCCCTGG GCATTGTCGC GGCCCTCCTC 
CTGCTCCCTT CGGCCTCGAA GGTCGGTGGC GGAAAGGCCA AGCCGGCTCC CTTGCCGCTG 
GATACTCAGC GGTGGCTGAC TGTCGGGCGG CTGACGGTGT TCTGCTTCGC CATGGGGGTG 
GCCGGTTCGG CCTACTGGAT CTTCGCACCC GATTTGGTGG TCGAGATCGG CGGGCTGTCC 
GAGCGGTTGA CCGGAATGCT CTGGCTCGTG GTCGGCATTG CCGGGCTCGC CGGCGCCTGG 
GCGAGCGACC TCGGCGATCG GCTGGGGGCG CCTGCCACCC AGGCCATCGC GTTGGTGGCT 
CTGGGGGCGG CGACGGCGCT GGTCGCCGCG GCACCGGGTG ACGTGTGGAT GGCACTGGTG 
TCGGCCGCCG TGTTCGGTTG GGCCTTCATG ACCCTGACCG GGCTGTATCT GGTCACCGGC 
ATCCGGCTGT TGCGCGAGCG CCCGTCCATG GGGCCGGTCG TGCCGTTCCT GGCCATCACC 
GTCGGGCAGG CTGTCGGATC GCCCTTGGTC GGGTGGGCCA TCGGCAACGC GGGCTATGTG 
GAGGCGTTCC TGATGTTCGC AACGCTGGCG GTTCTGATTG CGGCCTTTTC GTTCCTGTTC 
CCCCGTCCTG CCAGCGACGC AGCGGATGAA GGGGGGGAGG GCGCGGCCGA GTCGCGGATG 
GCCGCGGCCC CTGCCACGTC GAAGCGGGCT ATGCAGGATG GACAGTCCGA AACGGAATCC 
ATCTGA

Protein sequence

MRAVNATGFA ILGAGLIAIA YGLARYAYGL FVPSIRSELG LSADAVGVVG SMAFISFCLA 
SVVAPLIVDR LGARYSAVLS GLFALAGLTL ISQAGDAITL GAGVFACGIC TGLMMPALSS 
GVQTNIRPDL RGRVNAVMNA GTSAGLILCV PAVLLLSGAW RMAYGSFAVL AALGIVAALL 
LLPSASKVGG GKAKPAPLPL DTQRWLTVGR LTVFCFAMGV AGSAYWIFAP DLVVEIGGLS 
ERLTGMLWLV VGIAGLAGAW ASDLGDRLGA PATQAIALVA LGAATALVAA APGDVWMALV 
SAAVFGWAFM TLTGLYLVTG IRLLRERPSM GPVVPFLAIT VGQAVGSPLV GWAIGNAGYV 
EAFLMFATLA VLIAAFSFLF PRPASDAADE GGEGAAESRM AAAPATSKRA MQDGQSETES 
I