Gene Hlac_0851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0851
Symbol
ID	7400817
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	844205
End bp	845218
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	68%
IMG OID	643707917
Product	periplasmic solute binding protein
Protein accession	YP_002565520
Protein GI	222479283
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0803] ABC-type metal ion transport system, periplasmic component/surface adhesin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCACT CACGGCGGTC GGTGCTGCGT CGCGGCGCCG GTCTCGCGGT CGCGGGAACG 
GCGGCGTCGT TAGCCGGCTG TTCCGGCACC ACAAACGGCG GATCCGGTGG GTTCGACGCC 
GGCTACGCCG CCTTCTTCAC CCTCAATGAC TGGGCGAATC AGGTCGCGGG CGACCACGCG 
AGCTTCGAGG ACCCGGTCGA CGTGGGGCAG CTCGGTCACG GCTGGACGCC GGACGGGAAC 
CTCGCTGTAG ACGTCGCCTC CACCGACGCG TTCGTCTACC TCGACAGCTC GGAGTTCTCG 
TGGGCGCAGG ATCTGGCCGC GACGCTGGAG GACGATTACG ACACGGTCGC CGTGATCGAC 
GGGCTCGCCG GGCTGGAAGA GGACCTCCTT GAGTGGGACC ATAGCCACGA CGAAGAGGAG 
GAAGACGCCC ACGACGACGA AGACAGCCCC GACGACGAAG ACGGCCCCGA CAGAGGGCAG 
TACGACCCCC ATGTCTGGGT CGATCCGGTG CTTGCCGCCG ATGTCGTCGA CACCATCGCG 
GCAGGGCTCG GCGAGGCGGA CCCGGACAAC GCCGACGACT ACGCCGACAA CGCCGCCGCC 
TACGCCGAGG ATCTCGACGC GATCGACGAT GCCTTCGAGT CAATCGCCGA GAACGCCGAG 
CGCGGCGTGG CGGTCATGGC GGGCCACAAC TCCTTTCAGT ACCTAGAGGC GCGCTACGGG 
TTCCGGCTCC ACTCGCCGGT CGGCGTCTCG CCGCAAAACG AGCCGACGCA AAGCGAGATC 
GCCGACACGA TCGAACTCGT GAACACGGAG GGGATCGACG CGGTGTTGTA CGACCGCTTC 
GAGTCGCCCA GGCTCGCCGA GTCGATCGTC GAGAACAGCG ATGCCACCGA GGCGGTCCCC 
GTCACGCCGG CCGGGGGGAC GACCCGTGAG TGGAACGACG CCGGGTACGG CTATCTCGAA 
CAGATGACCG AGATCAACGT CCCCGCCTTC GAGCGGGCAT TCGACGCGCA GTGA

Protein sequence

MTHSRRSVLR RGAGLAVAGT AASLAGCSGT TNGGSGGFDA GYAAFFTLND WANQVAGDHA 
SFEDPVDVGQ LGHGWTPDGN LAVDVASTDA FVYLDSSEFS WAQDLAATLE DDYDTVAVID 
GLAGLEEDLL EWDHSHDEEE EDAHDDEDSP DDEDGPDRGQ YDPHVWVDPV LAADVVDTIA 
AGLGEADPDN ADDYADNAAA YAEDLDAIDD AFESIAENAE RGVAVMAGHN SFQYLEARYG 
FRLHSPVGVS PQNEPTQSEI ADTIELVNTE GIDAVLYDRF ESPRLAESIV ENSDATEAVP 
VTPAGGTTRE WNDAGYGYLE QMTEINVPAF ERAFDAQ