Gene Hlac_2521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2521
Symbol
ID	7401573
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	2499609
End bp	2500655
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	62%
IMG OID	643709593
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_002567164
Protein GI	222480927
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1175] ABC-type sugar transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.519073
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGATT TTTACCGTCG ATTGCACCGG ACGATCAGTC CCTCCTCGAG GGACGACGAC 
AGCGAGGTCC GTACCGACGG CGGGGTCGTG AGCGACGGCC CTGGCGCCGA CCCGGCGCCG 
GAACCGGACC GGGACCTGAC GACCCGTCTC AAGGCGACCT TGGACCAGCG CTTCGGGAGC 
GACTTCATCG AGTCGTCCGT CTTCTGGCTC CCTCCGTTCC TGCTGATGGG GCTGTTCGTC 
TACGGTGCGA TCATCTGGAA CCTGCTGATC TCGCTGACCG ACTACCAGCG CTTCGAGAAC 
GCGCCGGACT ACTCGAACCT CGACTTCGAG ATGTACACGC GTGCGCTCGC AGACACCGGG 
TTCATCGACG CCGCGATCAA CACGCTCATC CTGCTTATCG CGTTCACGGC GGGGACGCTC 
GTGGTCGGCC TCGTGCTGGC TATCCTAATC GATAGAGGGA TCCGGTTCGA GAACACGTTC 
CGGACGATCT ATCTCCTGCC GATGAGCCTC TCGTTCGTGG TGACCGCCCA GTTCTGGCTG 
TGGATCTACA ACTACAACAA CGGGATCGCC AACAACGTCA TCGGCACTGT CGGTCTCGGC 
CCAGTGAGCT GGCTCGGCAA CCAGGACATC GTCCTCTACG CGGTCATCTT CGCGTTGATG 
TGGCAGTTCT CGGGGTACGC GATGGTCGTG TACCTCGCTG GGCTCCGAGC CATTCCGACA 
GAGCACTACG AGGCGGCCAC GGTCGACGGC GCGTCGACCC TGAAGATGTA CTGGCGCGTT 
ATCATCCCCC AGTTGAAGGG CGCGACGATC AGCGCCGCCG TAGTGCTGAT GGTGTTCGGG 
ATGAAGGCCT TCGACTTCCT CTACTCGCTG TCAGGGGGAT ACCGGCCGCC GAACGGCGCC 
GATATCTTAG CGACGAAGAT GGTTCGTGAG GCGTACGCGA ATCTCAACTG GGCGTACGGG 
TCGGCGATCG CGATCGTCCT GTTCGGAATG GCGCTCAGCG TCATCGGCCC CTACCTTGTG 
TACGAATACC GGAGGGACAA CCTATGA

Protein sequence

MLDFYRRLHR TISPSSRDDD SEVRTDGGVV SDGPGADPAP EPDRDLTTRL KATLDQRFGS 
DFIESSVFWL PPFLLMGLFV YGAIIWNLLI SLTDYQRFEN APDYSNLDFE MYTRALADTG 
FIDAAINTLI LLIAFTAGTL VVGLVLAILI DRGIRFENTF RTIYLLPMSL SFVVTAQFWL 
WIYNYNNGIA NNVIGTVGLG PVSWLGNQDI VLYAVIFALM WQFSGYAMVV YLAGLRAIPT 
EHYEAATVDG ASTLKMYWRV IIPQLKGATI SAAVVLMVFG MKAFDFLYSL SGGYRPPNGA 
DILATKMVRE AYANLNWAYG SAIAIVLFGM ALSVIGPYLV YEYRRDNL