Gene Hlac_2073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2073
Symbol
ID	7400593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2061563
End bp	2062933
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	67%
IMG OID	643709144
Product	seryl-tRNA synthetase
Protein accession	YP_002566721
Protein GI	222480484
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0172] Seryl-tRNA synthetase
TIGRFAM ID	[TIGR00414] seryl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.400527
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.190866
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTCTC GACAGTTCGT CCGGGAGAAC CCCGAGGTCG TTCGCGAGGC GCTCGACAAC 
AAGGGCGTCG ACGTGGACCT CGACCGGATA CTCGACGTTG ACGAGGAGTG GCGGGAGCTG 
AAGAGCCGTG GCGACGATTT GCGCCACGAG CGCAACGAGG TCTCCTCGAC GATCGGCGAG 
CTGAAACAGG CCGGCGAGGA GGAGGCGGCC CAAGAGGCGA TCGAGCGCTC ACAGGAGGTC 
AAGTCGGAGC TGCAGGAGAT CGAAGAGCGC GCCGACGAGC TGGAGGCCGA ACTGGAGGAG 
TCCCTGCTCG AACTCCCCCA GATCCCCCAC GAGTCGGTGC CGGTCGGGGC CGACGAGTCG 
GAGAACGTCG AGCGACGCCG CGAGGGGTTC GACGACCTGC GCGAGGTTCC CGACAACGTG 
GAGCCCCACT ACGATCTGGG CGAGGAGCTG GAGATCCTCG ACTTCGAGCG CGGCGCGAAA 
GTCGCCGGCG GCGGCTTCTA CGTCGCGAAG GGCGACGGCG CCCGGCTGGA GCATGCGCTG 
ATCCAGTTCA TGCTCGACGT GCATCGCGAG CAGGATTACC GTGACGTGTT CCCGCCGATC 
GCGGTCAACT CCACGTCGAT GCGCGGCACC GGCCAGCTCC CGAAGTTCAC CGAGGACGCC 
TACCGGATCG AGGGGACCAA CGAGGACGCG TACGACGACG ACGACCTCTG GCTGCTCCCG 
ACCGCGGAGG TGCCCGTCAC GAACCTCCAC CGCGACGAGA TCCTGCTCGG CGAGGACCTC 
CCGCTCAAGT ACCAGGCGTA CACGCCGAAC TTCCGGCAGG AGGCGGGTGA GCACGGCACC 
GAAACGCGCG GGATCGTCCG CGTCCACCAG TTCAACAAGG TGGAGATGGT GAACTTCGTC 
CGGCCCGAGG AGAGCCACGA GCGCTTCGAG GGCCTCGTCG ATGAGGCCGA GGAGGTGCTT 
CGCCGCCTCG AACTTCCCTA CCGCATCCTG GAGATGTGTA CCGGCGATCT GGGGTTCACG 
CAGGCGAAGA AGTACGACCT TGAAGTCTGG GCGCCGGCCG ACGACATGGA CGAGGGCCCC 
GCAGAGGGCG GCCGCTGGCT GGAGGTCTCC TCCGTCTCGA ACTTCGAGGA ATTCCAGGCG 
CGCCGTGCCG GGATCCGGTA CCGCGAGGAG CACCACGAGT CCGCGGAGTT CCTCCACACC 
CTGAACGGTT CGGGGCTCGC CGTCCCGCGG ATCGTCGTCG CGATCTTGGA GTACTACCAG 
AACGACGACG GCACCGTCAC CGTCCCCGAG GCGCTGCGCC CGTACATGGG CGGCACAGAG 
GTGATCGAGG GTCACGACGC GGTCGGCGAG ACGAAGCTCG GCGGGGAGTA G

Protein sequence

MLSRQFVREN PEVVREALDN KGVDVDLDRI LDVDEEWREL KSRGDDLRHE RNEVSSTIGE 
LKQAGEEEAA QEAIERSQEV KSELQEIEER ADELEAELEE SLLELPQIPH ESVPVGADES 
ENVERRREGF DDLREVPDNV EPHYDLGEEL EILDFERGAK VAGGGFYVAK GDGARLEHAL 
IQFMLDVHRE QDYRDVFPPI AVNSTSMRGT GQLPKFTEDA YRIEGTNEDA YDDDDLWLLP 
TAEVPVTNLH RDEILLGEDL PLKYQAYTPN FRQEAGEHGT ETRGIVRVHQ FNKVEMVNFV 
RPEESHERFE GLVDEAEEVL RRLELPYRIL EMCTGDLGFT QAKKYDLEVW APADDMDEGP 
AEGGRWLEVS SVSNFEEFQA RRAGIRYREE HHESAEFLHT LNGSGLAVPR IVVAILEYYQ 
NDDGTVTVPE ALRPYMGGTE VIEGHDAVGE TKLGGE