Gene Hlac_0952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0952
Symbol
ID	7401846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	947327
End bp	948406
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	69%
IMG OID	643708018
Product	carboxylate-amine ligase
Protein accession	YP_002565620
Protein GI	222479383
COG category	[S] Function unknown
COG ID	[COG2170] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02050] uncharacterized enzyme

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACTCG GTTCGCGGGA CGCGTTCGCC CGGATGGAGA CCCTCGGCAT CGAAGAGGAG 
TTCTACATCG TCGATGCCGA CGGCCGCCCG ACCTCGGGGA TTGACGATCT CGTCTACGGC 
CGCGATCCGC CGGCGGAAGT CCCGGAGGGG TTCGACCACG AGCTGTTCAA GTGCACCATC 
GAGGCCCAGA CGGAACTGAT CGAAGATCCG TCGAACGCGG TCGACGCCCT CTCGACGGTG 
CGGGCGGCGC TCGTCGATCA CGCCGCCGCC GACGGCTACC GGATCGCGGC CGCGGGCCTC 
CACCCGGCCG CGAAGTGGCG GGAGCTCGAA CACGCGGAGA AGCCGCGGTA TCAGGCGCAA 
CTCGACCGGA TCCAGTACCC GCAACACCGA AACACGACGG CGGGGCTCCA CGTCCACGTC 
GGCGTCGACG ACGCGGACAA GGCCGTCTGG ATCGCCAACC GACTCCGGTG GCACTGCCCC 
GTGCTGCTCG CCCTCTCGGC GAACTCCCCG TTCTGGAACG GCTTCGACAC CGGGCTCGCG 
TCGGCCCGTG CGAAGATCTT CGAGAATCTC CCGAACACGG GGATCCCCTC CGCGTTCGAC 
GACTTCGACG CCTTCCAGCG CTACGAGCGC CGGATGGTCG AGCGGGGCTC TATCGCCGAC 
CGCGGCGAAC TCTGGTTCGA CGTGCGCCCC CACACTGGCC ACGGCACGGT CGAGGTGCGC 
GCCCCGGACG CCCAGCGCGA CCCCGGGGTC ACTCTCGCGT TCGTCGAGTA CGTCCACGCC 
CTCGTCGTCG ATTACGCCGA GCGCTACGCG GACGGCGAGT CCCCGCCGAC CCTCCGCCGG 
GAGCTGTTAG ACGAGAACAA GTGGCGGGCG ATCCGCCACG GTCACGACGC CTCCTTCATC 
ACTCGCGACG GCGAGGACAC GGTCTCGCTC GGCGAGGCCG TCGCCGACGA GTGCGACCGC 
CTCGGAATCG ACGGGATCCG AGACGTGTAC GACGCCGAGA GCGGGAGCCA GCGCCAGCGC 
CGACTCCGCG AGGAGGGCGG TCTCGACGCG CTCTGTGACG ACCTCATGCT GTCGCCGTAG

Protein sequence

MELGSRDAFA RMETLGIEEE FYIVDADGRP TSGIDDLVYG RDPPAEVPEG FDHELFKCTI 
EAQTELIEDP SNAVDALSTV RAALVDHAAA DGYRIAAAGL HPAAKWRELE HAEKPRYQAQ 
LDRIQYPQHR NTTAGLHVHV GVDDADKAVW IANRLRWHCP VLLALSANSP FWNGFDTGLA 
SARAKIFENL PNTGIPSAFD DFDAFQRYER RMVERGSIAD RGELWFDVRP HTGHGTVEVR 
APDAQRDPGV TLAFVEYVHA LVVDYAERYA DGESPPTLRR ELLDENKWRA IRHGHDASFI 
TRDGEDTVSL GEAVADECDR LGIDGIRDVY DAESGSQRQR RLREEGGLDA LCDDLMLSP