Gene Hlac_0358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0358
Symbol
ID	7399751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	377639
End bp	378910
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	67%
IMG OID	643707423
Product	major facilitator superfamily MFS_1
Protein accession	YP_002565032
Protein GI	222478795
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.359815
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTCTG CCGAGCAACG GATCGTGGCG TTCACCGCCG GATCGCACGG GCTCGTCCAC 
ACCTACGAGC TCTCGATCCC GATTCTGTTG ACCGTGTGGG TCGGGGAGTT CTCGACGACG 
GCCGCGGTTC TCGGACTCGT CGTGACTGTC GGCTACGGAC TGTTCGGCGT CGGCGCACTT 
CCGGGCGGCA TCCTCGTCGA CCGATTCGGG TCCAAGCCGC TCATTCTCGC CTGTCTCGGC 
GGAATGGCGG GATCGTTTCT CCTCGTGAGC CTCGCGCCCA ACCTCCTCAC GCTCGCGCTC 
GCGATCGCCG TGTGGGGGGT CACTGCGAGC GTCTATCACC CGGCGGGGCT GTCGCTGCTC 
TCGAAGTCGG TCGATCAGCG CGGGACTGCG CTCGGCTACC ACGGGATCGG GGGGAACCTC 
GGGATCGCGC TCGGCCCGCT GGCGACCGCG CTCCTCCTCT TAGCCTTCGA CTGGCGGATC 
GTCACGGCCG CGCTCACGGT ACCCGCGGCC GTGGTCGCCG CCTACGGTCT CACCGTCGAT 
ATCGACGACG CGCTTCCTGA CACTGAGAAC GCGGTTTCCG ATGGCGACAT CGACGGCGAC 
GGAGGGAGCG GCGCGAACGG AGCGGCCTCG CTGTCGACGA TCGCCGACGA CACGCGCGTG 
CTGCTCGCCG GCGGCTTCCT GATCGTGTTC GTCTTCGTCA CGTTCAGCGG ACTCTACTAC 
CGCACGTTTC TCACGTTCCT GCCGGATCTC CTCGGCGACG TACTCGGCGG GCTGATCGAT 
ATCCAACTCA TCGACCCTGA AAGCCCGTAC GCCGAGGAGT TCGACGTGGC ACGATATCTG 
TACGTCGCCG TTCTCATGGT CGGCGTACTC GGGCAGTACC TCGGCGGGCG GATCGCCGAT 
CGCGTGCCGC CGGAGCGCGC GCTGATGGTT CTGATGGGAA TATTGACGGT CCTCGCGCTG 
TTGTTCGTCC CCGCCAGCGA GACCATCGTG ACGTTCATCG CGGTCTCACT GCTGCTCGGC 
GTCGTGCTGT TCACGGTCCA GCCACTCTCG CAGGCGACGG TCGCGGCCTA CTCTCCGAGC 
GAGGCGCGCG GGATCTCGTT CGGCTACACG TACCTCGGGA TCTTCGGTTT CGGCTCGCTG 
GGCGCTGCGC TCGCGGGGAC GGTCCTCACC CGAGCGGGAC CACGAGAGCT CTTTTTCGTC 
CTCGCGGGTA TCGCGGCCCT CGGCGCCCTC TCCGCGGCCG GAGTCTCTCG GCTCGCGACG 
CGGCAGGACT GA

Protein sequence

MDSAEQRIVA FTAGSHGLVH TYELSIPILL TVWVGEFSTT AAVLGLVVTV GYGLFGVGAL 
PGGILVDRFG SKPLILACLG GMAGSFLLVS LAPNLLTLAL AIAVWGVTAS VYHPAGLSLL 
SKSVDQRGTA LGYHGIGGNL GIALGPLATA LLLLAFDWRI VTAALTVPAA VVAAYGLTVD 
IDDALPDTEN AVSDGDIDGD GGSGANGAAS LSTIADDTRV LLAGGFLIVF VFVTFSGLYY 
RTFLTFLPDL LGDVLGGLID IQLIDPESPY AEEFDVARYL YVAVLMVGVL GQYLGGRIAD 
RVPPERALMV LMGILTVLAL LFVPASETIV TFIAVSLLLG VVLFTVQPLS QATVAAYSPS 
EARGISFGYT YLGIFGFGSL GAALAGTVLT RAGPRELFFV LAGIAALGAL SAAGVSRLAT 
RQD