Gene Hlac_2327 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2327
Symbol
ID	7401944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2322485
End bp	2325343
Gene Length	2859 bp
Protein Length	952 aa
Translation table	11
GC content	67%
IMG OID	643709400
Product	TRAP transporter, 4TM/12TM fusion protein
Protein accession	YP_002566973
Protein GI	222480736
COG category	[R] General function prediction only
COG ID	[COG4666] TRAP-type uncharacterized transport system, fused permease components
TIGRFAM ID	[TIGR02123] TRAP transporter, 4TM/12TM fusion protein

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.648289
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACGA CCAATCGAAC CGACGGCGGT ATCGACGACT CGAACGACGG CGGCTCCGGA 
GGGCCACCCC CCGGCGACCT CGGCAGCGGT TCGGGCGCGG ACGAGCCGCC GGACGACAGG 
ACGGACGAGG AGATCTCCCG CGAGGAGGCG GACGATCTGA TAGAGGAGAT CGAGCGCCGC 
CGCTCGCTGC GGGGACCAGC CGCGATAGCG GTCGCGATCA TCGGAATCGC GTTTTCCGTC 
TTCCAGTTAT TCCTCGCCGC CCGGAGCTAC ACGTTCACGA TCTGGCTCCC GACCGTCGAT 
ATCGCGGGGA TCTCGATCGC CCCCTGGCAG GTCTCGCTCC AGCTCCTGCA GGCGAACGCG 
ATCCACGTCG CCTTCGCGCT CGTGCTCACC TTCCTACTGT TCCCGGTGAG CACCGGCGAC 
GGGATGGTCA CGCGGAATTT CGGTCGGATC GCCCCGGCGG CGTCGCAGCG CCTCGGCGAC 
CGGAGTCCTG TCACGCGGGC GCTCGAAGGA GGTCGGACGG GGCTTCGCTG GGCGTTCCTC 
GACCCCGACC GCGAGCGGGT GACTCCGGTC GACATACTGT TCATCGCCGT GGCGTTCCTC 
TCGGCGTTCT ACTTCATGAC GGAGTTCGCG GAGATCCAGA ACATGCGCGT CTTCGGGGTC 
GACTCGGGGC GGCCGGTTAC CGAGGTGTAC GCGTTCCTCC AGCCCCTGCT CGGCGGCGTC 
CCGTTCGTGA GCGAGTACTC CTACGCGATG ATTCTGGGCG TGGCCGGCAT CCTGCTGGTG 
TTGGAGGCCA CCCGCCGGAC GCTCGGCCTC CCGCTGATGC TCATCGTCGC CACGTTCATC 
GTCTACGCCC GCTGGGGCTA CCTCATCAGT GGGGACACCC CGTTCCTCGG CCTGCTCGCG 
ATCCCGCCGC TCTCCTGGCC GGATATCGTT CAGAACCTCT GGTACAACAC CGAGAACGGG 
GTGTTCGGTA TTCCGGTGAC GGTGTCGATG AGCTTCATCT ACATCTTCAT CCTGTTCGGC 
TCGTTCCTCG AGATGAGCGG GGCCGGCCAG TGGTTCATCG ACCTCGCGTA CGGGCTCACC 
GGGGATCGTA AAGGCGGCCC GGCGAAGGCG AGCATCCTCG CCAGCGGGTT CATGGGAACG 
ATCTCGGGGT CGTCGATCGC CAACACGGTC ACGACCGGCG CGTTCACGAT CCCGCTGATG 
AAGCGGTCGG GCTACGATCC CGAGTTCTCC GGCGCCGTCG AGGCGTCCGC GTCGTCCGGC 
GGGCAGATCC TCCCGCCCGT GATGGGGGCG GCCGCCTTCC TGATGGTCCA GTACACGTCG 
ACGCCGTTCG CCGACATCAT CATCATCGCG ACGATCCCGG CGATCGTCTT CTTCTTCGGC 
GTCTGGGTGA TGGTCCACCT CAAGGCGGTC CAAGAGGGGA TCGGCGGCGT CTCCGGCGAG 
GACACGGTTA ACTTCTGGGA CCACTTCAAA CGCGGCTGGT TCTACCTCGT GCCGATCGCA 
CTGCTCCTGT ACTACCTCAT CATCGAGCGG CTCTCGGTCT CCCGGTCGGC GTGGTTCACG 
ATCGTGGCGC TCGTGGCGCT GGTCGCGCTC GTCTCGGCGT ACAGCGAGGA GACGCGGCTG 
CGCCTCTTCG CCGTCTTCGC GGCGATCGTC GGCGTCGAGT TCGCGAGCCA CGCGCTGGCC 
GGCGTGAACG TCGTCGGCCT CGTCACCGGA GCCGGCGGTG CGGGGCTCCC GCCCGGCGAG 
GCGTTCAGCG CCATACTTGC GGGGATCGAG TGGTACGCAA TGCTCGCCGG GGTGCTCACG 
CTGCTGTCCA AGCCCGATCT CGACGCGTCG CTGCTCGAGC TCAACCCCTC GGTTCAAGAC 
ACGGCCGAGA CGATCGGCGA CCGGACCGAC CGGGACTTAG AGAACAGCCA GCCGTTCAAA 
CTCGGCACCT TCGTGGTCAC GTCGATGGAG CAGGGCGCGC GCACCGCGGT CCCGGTCGTG 
GTCGCGGTCG CGGCCGCGGG GATCATCCCC GGCGTCATCA GCGTCTCCGG GCTCGGCCCT 
AACCTGACCT CGCTGCTGTT AGCGCTCTCT GGGGGGTCGA TCGTGATCAT GCTGCTCGTG 
ACGGCCGTCT CGAGCATCAT CCTCGGGATG GGAATGCCCA CGACGGTCAC CTACATCATC 
CTCATCTCGA TGCTCGCGAC GCCGCTCGTG GAGTTCGGTA TCCCGCTTCT GGCCGCCCAC 
CTGTTCATCC TCTACTTCGG CGTGATCGCC GACATCACGC CGCCGGTGGC CGTGGCGGCG 
TACGCCGCCA GCGGGATCGC CAAGTCCGAT CCCTTCGAGA CCGGCGTGAA GGCGTTCTCG 
CTGTCGCTGA ACAAGGCGAT CGTCCCCTTC GCGTTCGTGC TCGCGCCGGG GATCGTCCTG 
CTGCGCGAGA AGGCGAACGC CGCCGACCTG CCGATCCGCG AACAGTACCG CGTGGTCGGG 
TTCGCGGACC TCGCCGAGCT GTCCTACTCG GTCCCCGAGA TTCTCATCCC CATCGCCGGG 
GTCTTCCTCG GCGTGATCGC GCTCGGCGCG ACCGTCATCG GGACACTGTA CACGCGTGTC 
GGCCGGCTCA GTCGGGCCGT GTTCGCCCTC AGCTCGCTGC TGTTGATGGC GCCGGGGCTG 
CTCTCCGAGA GCGTCTTCGA CACGCTCGGG CTCGTTGGCG TGAGTGTCTC CGTCAACGCG 
CTCCTGCTTG ATTTGACCCT ACGCGCGGTC GGGTTCGTCC TGTTCGTGCT GTTCGCGCTC 
CGGAACCGAC GGACGCTCGA CGGCGAGGGC GACGGAGCGG GAGAGACCGA CGCGACAACG 
GGATCGACCG AGGCCGTCGC CGCCTCCGAC TCGTCCTGA

Protein sequence

MTTTNRTDGG IDDSNDGGSG GPPPGDLGSG SGADEPPDDR TDEEISREEA DDLIEEIERR 
RSLRGPAAIA VAIIGIAFSV FQLFLAARSY TFTIWLPTVD IAGISIAPWQ VSLQLLQANA 
IHVAFALVLT FLLFPVSTGD GMVTRNFGRI APAASQRLGD RSPVTRALEG GRTGLRWAFL 
DPDRERVTPV DILFIAVAFL SAFYFMTEFA EIQNMRVFGV DSGRPVTEVY AFLQPLLGGV 
PFVSEYSYAM ILGVAGILLV LEATRRTLGL PLMLIVATFI VYARWGYLIS GDTPFLGLLA 
IPPLSWPDIV QNLWYNTENG VFGIPVTVSM SFIYIFILFG SFLEMSGAGQ WFIDLAYGLT 
GDRKGGPAKA SILASGFMGT ISGSSIANTV TTGAFTIPLM KRSGYDPEFS GAVEASASSG 
GQILPPVMGA AAFLMVQYTS TPFADIIIIA TIPAIVFFFG VWVMVHLKAV QEGIGGVSGE 
DTVNFWDHFK RGWFYLVPIA LLLYYLIIER LSVSRSAWFT IVALVALVAL VSAYSEETRL 
RLFAVFAAIV GVEFASHALA GVNVVGLVTG AGGAGLPPGE AFSAILAGIE WYAMLAGVLT 
LLSKPDLDAS LLELNPSVQD TAETIGDRTD RDLENSQPFK LGTFVVTSME QGARTAVPVV 
VAVAAAGIIP GVISVSGLGP NLTSLLLALS GGSIVIMLLV TAVSSIILGM GMPTTVTYII 
LISMLATPLV EFGIPLLAAH LFILYFGVIA DITPPVAVAA YAASGIAKSD PFETGVKAFS 
LSLNKAIVPF AFVLAPGIVL LREKANAADL PIREQYRVVG FADLAELSYS VPEILIPIAG 
VFLGVIALGA TVIGTLYTRV GRLSRAVFAL SSLLLMAPGL LSESVFDTLG LVGVSVSVNA 
LLLDLTLRAV GFVLFVLFAL RNRRTLDGEG DGAGETDATT GSTEAVAASD SS