Gene Hlac_3544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3544
Symbol
ID	7402387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	-
Start bp	291875
End bp	293095
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	59%
IMG OID	643710082
Product	major facilitator superfamily MFS_1
Protein accession	YP_002567648
Protein GI	222481412
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGTTC CATTTTGGAA TTCATCTACG CTTCCCCCAA CGAACGTTCT GAAATATTAT 
CTCTACAAAT CGACCAAGGC CGTCGAGTTT TACCGCCCAA TTATGTATCT CTTTTTTCTC 
GCACAGGGGC TCACTTTTAC GCAGATCGCT ATTCTCGAGG CGATATACAA TCTGACGACG 
CTAGTCGGTG AGATCCCGAC AGGCTACATC GGCGACCGTG TCGGTCGGCG CAACAGTCTC 
CTCGTCGGCA CGACCCTCAT CTCGTTCACA CTCGTTGGCA TCGGCCTCTC CAGTTCGTTC 
CAAGCGCTCG CGGTGCTGTA CGTCTGCTGG TCAGCAGGGT ACAATTTCCG CTCTGGAAGC 
GAAGACGCGT GGCTGTACGA CACCCTCACA GACGGCCGCT CCGAGGACGC ATTCGCGAAC 
GTCCGTGGGC GGGGAGAGTC CATCGCACTG GCAATCGGCG CCGCGGCGGC TATCACCGGA 
GGGTATCTCG GAAGCATCGA CCTCTCGTAT CCGTGGTTCG TCGCTTCCGC GATGACGGCG 
GTCGGCGTGC TCGTCCTCCT GACGGTAGAT GAGTCGGAGA CCTACGAGCG AACCGACACC 
GATGATTTGA GCCTCCGACG GACGATCTTG ATCGTCCGAC AGACGCTCTC ACAGCGCAAC 
ATTCGGGCGT TCGTGCTGTA TTATTACGTC CTCTACGCGG CAGTGACATA CCTCGTGTTC 
GTGTTCCTGC AGCCGATCTT CGAGACGGTC GTGCTCGACC TCGGGGTGTC GCAGTCACGC 
GTGAAATCCC TCCTCGGATG GTTCTACGCA ACGTACAGTC TCTTCGGTGC GGGACTGAGC 
TACTACACTG GTGCGATTCG GGCTCGTCTC GGGCTTCGAA CGTGGTTTCT GTGGCTCCCC 
TTCATCGTCG GCGGCGCGCT GATAGGGATG TATTTCGTTC CGGTGCTCGC GCTTCCGACG 
TTCCTACTGA TTCGGGGACT TTCGGACGTG ACGCGGTCGT TCGCCGGACA GTACATCAAC 
GACCGAATCG GGACGATGGG GCGCGCGACC GTACTCAGCG CGATGGCGAT GGTGAGTGGT 
CTCGCCGTCG TTCCGTTTCA ACTCGGGAGC GGGATCCTCT CCGACGTCGC TTCGCCACTG 
TTCGCGCTCG CTGTGGCTGG TGGTGTGCTC GTCGTTGGTG CAACAGGGGT GCTGCTTTGG 
GAGGCACCGA TCGAGCGGTG A

Protein sequence

MAVPFWNSST LPPTNVLKYY LYKSTKAVEF YRPIMYLFFL AQGLTFTQIA ILEAIYNLTT 
LVGEIPTGYI GDRVGRRNSL LVGTTLISFT LVGIGLSSSF QALAVLYVCW SAGYNFRSGS 
EDAWLYDTLT DGRSEDAFAN VRGRGESIAL AIGAAAAITG GYLGSIDLSY PWFVASAMTA 
VGVLVLLTVD ESETYERTDT DDLSLRRTIL IVRQTLSQRN IRAFVLYYYV LYAAVTYLVF 
VFLQPIFETV VLDLGVSQSR VKSLLGWFYA TYSLFGAGLS YYTGAIRARL GLRTWFLWLP 
FIVGGALIGM YFVPVLALPT FLLIRGLSDV TRSFAGQYIN DRIGTMGRAT VLSAMAMVSG 
LAVVPFQLGS GILSDVASPL FALAVAGGVL VVGATGVLLW EAPIER