Gene Hlac_1984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1984
Symbol
ID	7402003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1979721
End bp	1981097
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	71%
IMG OID	643709055
Product	major facilitator superfamily MFS_1
Protein accession	YP_002566632
Protein GI	222480395
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.179831
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGACTGC TCGGGATCGA CCGGCCGCCG ACCGTGTTGC TCGCGGTGAT CGCCAGCACC 
TTTTTCGTCG GCTTTGGCGG CGGTGTCGTC TTCCCAATCC TCCCGAACCT CGGCGCGGTG 
CTCGGCATCT CGGCGTTCAT GGTCGGCGTG ATCCTCTCCG CGAACCGGTG GGTGCGCCTC 
GTCGCGAACG CGCCCGCCGG CGCCTTAGTC GACCGGTACG GAACGCGTAA ACCGTTCGTC 
GCCGGGCTGT TCGTCGAGGG CGTCGCCACC CTCGGATACG TCGTTGCGCT CGCGATGCCG 
CCCGCCGAGT CGCTCCGCCC GATCGCGGCG TCGCTACCGA CGTTTGCGGC CGGTCCGCTG 
GTCGTCGGCG CGGAGCAGTG GTTCACCCCG ATCGCGATCG TCGTCGCGCC CGAGACGTGG 
TTCCTGCTCG CGCGCATTCT CTGGGGGTTC GGCTCCGCGG CGGTGTTCGC GACGGCCTAC 
ACCATCGCCG CCGACCTCTC CGACAGCGGC TCGCGGGGGA CGAATATGGG CGTCGTCCGC 
GGCGGGATCA CGATGGGGTT CCCAGCGGGG CTCGTGCTTG GCGGCGTCGT CTCCGCGATC 
GCGGGCAACA TCGCCGCCTT CTCCGTCGCC GCCGCGTTCG CGCTCACCGC CAGCGTCGTC 
GCATACCGCT ACGTCCCGGA GACGCACGTC ACGGGCGATC GCTCCGGGGA TTCGATCAAG 
CCGTGGGATA TCGACACCGC CGTCCCCGCC GTGACCGTCG GGCTGGTCAA CTTCGGGCTG 
ATGTTCGCGT ACATCGGCGC GCTGTTCTCC ACGCTCGTGT TGTTCCTCGG CGCAAACGAC 
ATCTCCCTGT TGGGGCTCGC CCCGCAGGGG ACCTCCGGGC TGTTCATGGC CGGTACGGTC 
CTCTCGGCCG CGTTCTTCAT GCTCGTCGGC GGGCGGATCT CGGACACTCG TGACTCCCGG 
ACGCCGATAC TGCTGACGTT CCTCGTGGTC TCGTTCGTCG GGTTCCTGCT GCTCGCCCGG 
GCCGAATCGG TGGTCTCACT CGGACTCGCC TGCATCTTCA TCGGCGCCGG ACAGGGCGGG 
ACGAGCGGCC CGATGATGGC CCTGCTCGCG GACCTGACCC CCGACGAGCG GATGGGTCGG 
GCCTCGGGGA CGAACAACGT CCTCGGCGAC GTCGGCGGCG GCCTCGGCCC GATGGTGTCG 
CTCCCGCTGA TCGAGTCGGT CGGCTTCGCG CCCATCTACG CCGCCTGCGC GATCCTCCCG 
CTCGCCGCGG GCGCAGCGCT CCTCGTTGGC GTCCGCCGAG AGACCGGGAC GTTCCTTCCC 
GGACGCACCG CGGGCGAGAC GGACCCGGGC GAGGGGTCGC CCCCCACGGA GCCGTAG

Protein sequence

MGLLGIDRPP TVLLAVIAST FFVGFGGGVV FPILPNLGAV LGISAFMVGV ILSANRWVRL 
VANAPAGALV DRYGTRKPFV AGLFVEGVAT LGYVVALAMP PAESLRPIAA SLPTFAAGPL 
VVGAEQWFTP IAIVVAPETW FLLARILWGF GSAAVFATAY TIAADLSDSG SRGTNMGVVR 
GGITMGFPAG LVLGGVVSAI AGNIAAFSVA AAFALTASVV AYRYVPETHV TGDRSGDSIK 
PWDIDTAVPA VTVGLVNFGL MFAYIGALFS TLVLFLGAND ISLLGLAPQG TSGLFMAGTV 
LSAAFFMLVG GRISDTRDSR TPILLTFLVV SFVGFLLLAR AESVVSLGLA CIFIGAGQGG 
TSGPMMALLA DLTPDERMGR ASGTNNVLGD VGGGLGPMVS LPLIESVGFA PIYAACAILP 
LAAGAALLVG VRRETGTFLP GRTAGETDPG EGSPPTEP