Gene Hlac_1768 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1768
Symbol
ID	7399640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1785672
End bp	1786970
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	68%
IMG OID	643708833
Product	major facilitator superfamily MFS_1
Protein accession	YP_002566417
Protein GI	222480180
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0114747
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCAACG CGGACGCAGG CAACGGGGCA AAGCGATCGC AGTTCTGGGC GCTCTATCTC 
ACGCGCTTCG CTGAGGGGTT CGGCTTCATC ACGCTCATCA CCCTGTTGGG GACGTACATC 
AACACGCTCG ACCCGCAGGC GACGACGGTC CTCGGCGTGT CTATCTCGGC CGGACTCATC 
ATCGGGATGT ACACCACGGG ATTCACCCTC GCGCAGACGG TTGCCGTGGT GCCGCTGGCG 
TGGGCCGGCG ACCGGTTCGA CAAGCGAACC GTCCTGCTGG GCGTACTCGC GATCGGTGCC 
GGCGTCTACG CGCTGTTCCC GCTCGTCGAC TCCTCCGCCT CGTTCATCCT CGTCCGCGCC 
CTGCAGGGAC TCGTGGTCAC CGGTGCGGGG CTGATGACGC TGTCGCTGGT CGGACAGATC 
GCGGATGTCG GGACGCGCGC CGACAAGATT GGCAAGGCCA ACGCCGCCTC CTTCGCAGCG 
TCCATCGTCG GGTCGCTGTC GGCCGGAGCG ATATACGACG CGGTCGGCTT CGATCCCATC 
TTCATGATCA TCGCGTTGCT GATGGTCGCC GCGTGGGTCA TCACGTGGCT CGTCCTCGAC 
GACGACGACA CTCGCGTCGA GGGCTTCCCC TTCTCGGATC TCGCTGTGAA CCGGCGGATC 
CTCACGATGA CGAGCTTCCG CGCCCAGTAC GCCTTCGCCG TGACGATGGT GCGGACGTGG 
GTCCCGATCT ACGTCAGCAC GGAGATGGCC GCGGGCGGCC TCGGCGTCAC CGGCATCGCC 
ATCGGGGTCA CCGTCACCGC CGAGAAGGCG ACCAACATGG TCGGCCAGCT GTTCACCGGT 
CGTCTCTCGG ACGACTACGG TCGGTCCCTG TTCGTCTTCG CCGGCGGCGG CGCCTACGGG 
CTGATCGCGA TGGCGATCCC GTTCTCGGCC GTCATCGGAA CCGCGCTCGG AGCCGGGGTG 
ACGCTCCCGA TTCTGGGCGA ACTGCCGGCC GCGTACCTGC CGCTCGTCGC CTTCTCGGGA 
CTGCTCGGTA TCGCCGACTC CTTCCGTGAG CCGGCCAGTA TGGCGCTGTT CGCGGACGAG 
GGGACCGACG ACGGCGGGGT CGCCTCCAGC TTCGGCATCC GCGAACTCGT CTGGCGGCCG 
GGCTCGGTGG CGGGACCGCT CATCGCCGGC TGGCTGATGA TCGAGGTGAA CATGGCGTCC 
GTCTTCTACG TCGGCGGCGC GTTCGCGATC ACCGGCGTCC TCGCGTTCCT CGCGATCCTC 
GCGCACGACC ACGGCCGCGC GGCGCTGACG GCGTGGTAG

Protein sequence

MSNADAGNGA KRSQFWALYL TRFAEGFGFI TLITLLGTYI NTLDPQATTV LGVSISAGLI 
IGMYTTGFTL AQTVAVVPLA WAGDRFDKRT VLLGVLAIGA GVYALFPLVD SSASFILVRA 
LQGLVVTGAG LMTLSLVGQI ADVGTRADKI GKANAASFAA SIVGSLSAGA IYDAVGFDPI 
FMIIALLMVA AWVITWLVLD DDDTRVEGFP FSDLAVNRRI LTMTSFRAQY AFAVTMVRTW 
VPIYVSTEMA AGGLGVTGIA IGVTVTAEKA TNMVGQLFTG RLSDDYGRSL FVFAGGGAYG 
LIAMAIPFSA VIGTALGAGV TLPILGELPA AYLPLVAFSG LLGIADSFRE PASMALFADE 
GTDDGGVASS FGIRELVWRP GSVAGPLIAG WLMIEVNMAS VFYVGGAFAI TGVLAFLAIL 
AHDHGRAALT AW