Gene Hlac_1455 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1455
Symbol
ID	7400282
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1462308
End bp	1463492
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	70%
IMG OID	643708516
Product	major facilitator superfamily MFS_1
Protein accession	YP_002566113
Protein GI	222479876
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCACGGA GCCGGCTGTT TGGATCACTG TGTGCGATCG TCTTTCTCGT CAACTTCGCG 
CGGGTGGTGT TCGCGCCGCT CATCGGCGAG TTCATCAGCG AGTTCGCGAT CGGCGAGGGG 
ACGGCGGGAC TGATCGTCAC GCTCGCGTGG CTCGGCTCGG CCGCGCCGCG GCTCCCGGCG 
GGCTGGGCGC TCACGCGCTT CTCCCGGCAG TACGTGGTTC TCGTCTCCGG AGCGATGCTG 
ACAGTCGGTG CGCTCGGCGT CGCGCTGGCG CCGGGCGTCC CGACGCTGAT GGCCGCCGCG 
TTCGCGATCG GCTTGGCGTC CGGCGTCTAC TTCGTCGCCG CCAACCCGTT CATCGCGGAG 
CTGTTCCCGA CTCGGGTCGG GCGCGTGATG GGTGTCCACG GAATGGCGAG CCAGCTCGCC 
GCAGTCGCCG CCGCGCCGGT CGTCACGGTC GCGCTCTGGT ACGACTGGCG GCTCGCCTTC 
TACGGGCTCG CGCTCGCCTC GGCCGCCTCC ACCGTCGTCT TCGTCGCCTT GGCCCGCCGG 
ACGGACCTCC CGGACGCAGG CGCGGGCGAC ACCGATTTCC TCGCCGGCGC GCTCTCGGAG 
TGGAAGCTGA TTCTGGCGGG CGTCGTGTTG ATGGGACTCA CGAGCTTCGT TTGGCAAGGA 
CTCTTCAACT TCTACGAGCT GTACATGGTC GATAAGGGGC TCCCGCCCGC GGCGGCGCGG 
AACCTGCTGA CGGTGATCTT CGCCGCGGGC GTCCCGGCGT TTCTCATCTC CGGCGACCTC 
GCCGACCGGC TCCCGCACGT CCCATACCTA CTCGGGATCG TGTCTGTGTT CCTCGTCGGC 
GTCGTCCTCG TGGTCGTTTC CTCGGGGCTG GCCGCTGTCG TCGCCGCGAG CGTCGTCGTC 
GGCTTCGCCA TCCACATGCT GTTTCCCGCC GGCGACACCT ACCTGCTCGC GTCGCTGCCG 
GACGGGTCCC GAGCGTCGGC GTACGCCGTC TTCTCCGCCG GGATGATGAC GACGCAGGCG 
GCCGGCTCGT GGGTCGTCGG CGAGGCGATA GAGGCCGGCG CCGGCTACGA CGCGGTTTTT 
CTCTCCCTCG CCGGGGGACT CGCCCTCGTC GTCGTCGCCT ACGCGGTGCT TGAGTACGCC 
GGGCGCGTTC CGGGCGGCGC CGCGGGCACG GAGCACGCGG CCTGA

Protein sequence

MSRSRLFGSL CAIVFLVNFA RVVFAPLIGE FISEFAIGEG TAGLIVTLAW LGSAAPRLPA 
GWALTRFSRQ YVVLVSGAML TVGALGVALA PGVPTLMAAA FAIGLASGVY FVAANPFIAE 
LFPTRVGRVM GVHGMASQLA AVAAAPVVTV ALWYDWRLAF YGLALASAAS TVVFVALARR 
TDLPDAGAGD TDFLAGALSE WKLILAGVVL MGLTSFVWQG LFNFYELYMV DKGLPPAAAR 
NLLTVIFAAG VPAFLISGDL ADRLPHVPYL LGIVSVFLVG VVLVVVSSGL AAVVAASVVV 
GFAIHMLFPA GDTYLLASLP DGSRASAYAV FSAGMMTTQA AGSWVVGEAI EAGAGYDAVF 
LSLAGGLALV VVAYAVLEYA GRVPGGAAGT EHAA