Gene Hlac_2329 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2329
Symbol
ID	7401946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2326021
End bp	2327070
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	66%
IMG OID	643709402
Product	TRAP transporter solute receptor, TAXI family
Protein accession	YP_002566975
Protein GI	222480738
COG category	[R] General function prediction only
COG ID	[COG2358] TRAP-type uncharacterized transport system, periplasmic component
TIGRFAM ID	[TIGR02122] TRAP transporter solute receptor, TAXI family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.809783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTCAC ACCAAACACG ACGTAGATTC CTCGAAGCGA CCGGTGTCGC TGGCGTGGCC 
GCACTTGCCG GCTGTAGCGG AAACGGCGGC GATGGCAGCG ACGGAAGCGA CGGAAGCGAC 
GGAAGCGACG GTAGTGACGG AAGCGATGGC AGTGACGGAA GCGATGGCAG CGACGGAAGC 
GATGGCGGCG ACGGCGAGAC GCGCCTGACC TGGCACGCGG GCGGGACCGG CGGGACCTAC 
TTCCCCCTCT CGAACGAGAT CAAGACCATC GTCGACGCCA ACACCGACTT CACGCTGAAC 
GTCCAGTCCA CGGGCGCGAG CGTCGAGAAC GTCGGCAGCC TCGCCGACGG GTCGGCCGAC 
TTCGCGCTGA TCCAGAACGA CATCGCCTCG TTCGCGAGGA ACGGTACGGG CATCGACGCC 
TTCATCGACA ATCCGATCGA GAACCTTCGG GGCGTCGCGA CGCTGTACCC GGAGACGATC 
ACGCTCGTCA CGCTGGCGGA GAACGACATC TCCTCGGTCG ACGACCTCAG CGGCGCGACG 
ATCAACACCG GCGACCTCGG GTCGGGGACG CAGGTTAACG CGGTACAGAT CCTGGACTCG 
CTCGGAGTCA CCGACTACAA CGAGCAGAAC GCCGGCTTCT CGCAGGCGTC CGAACAGCTC 
GCCAACGGCG ACATCGACGC GGCATTCGTC GTCGGCGGCT GGCCGGTCGG CGCGATCGAG 
GAGCTCGCGA ACACGAACGA CATCGAGATC GTTCCGATCG GCGGCGACAG CCGCGAGGCC 
GTCAAGGAGG ACGCCTCCTG GTTCGCGGAC GACACCATCC CCGGCGGCAC GTATAGCGGA 
ATCGATGAAG ACGTCGAGAC GGTCGCCGTG CAGGCGATGA TCGCCACGAA CGCCGAGGTG 
CCGGACGAAA CCGTCCGGAC GGTCACCGCG GCCATCTTCG ATAACCTCGA CGAGCTCTCG 
ATCAAGACCG AGTTTATCAC CGTCGACACC GCACAGGACG GGATGTCCAT CGAGCTCCAC 
GACGGCGCCG CGGCCTACTT CGACGCGTAG

Protein sequence

MSSHQTRRRF LEATGVAGVA ALAGCSGNGG DGSDGSDGSD GSDGSDGSDG SDGSDGSDGS 
DGGDGETRLT WHAGGTGGTY FPLSNEIKTI VDANTDFTLN VQSTGASVEN VGSLADGSAD 
FALIQNDIAS FARNGTGIDA FIDNPIENLR GVATLYPETI TLVTLAENDI SSVDDLSGAT 
INTGDLGSGT QVNAVQILDS LGVTDYNEQN AGFSQASEQL ANGDIDAAFV VGGWPVGAIE 
ELANTNDIEI VPIGGDSREA VKEDASWFAD DTIPGGTYSG IDEDVETVAV QAMIATNAEV 
PDETVRTVTA AIFDNLDELS IKTEFITVDT AQDGMSIELH DGAAAYFDA