Gene Hlac_1973 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1973
Symbol
ID	7399925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1970495
End bp	1971532
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	66%
IMG OID	643709044
Product	Succinylglutamate desuccinylase/aspartoacylase
Protein accession	YP_002566621
Protein GI	222480384
COG category	[R] General function prediction only
COG ID	[COG3608] Predicted deacylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0907521
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG AACGGGTGTT CACGTACAAC GGCGGCGCGG TACCGCCGGG CGAGACGCAG 
AACATCCGCT ACGGCATCAG CGAGACGTAC CTCGGCGACC CGGTTCGGAT CCCCGTGACG 
ATCGTCAACG GCGAGCGCGA CGGGCCGACA GCGTTCCTCA TGGCGGCCGC CCACGGCGAC 
GAGCTCAACG GTATCGAGGT CGTCCGCGAG GTCGCCCACG AGTGGGACCT CTCGAAGCTC 
GCTGGCACCC TCGTCTGTCT CCCAGTGCTC AACGTTCCGG GGTTCCTCGC CCAACAGCGC 
TACCTCCCCG TCTACGACCG CGACCTGAAT CGGTCGTTCC CCGGGAAGGC CGGCTCGACC 
AGCTCGAAGC GGATGGCGAA TCAGATCTAC TCGAACTTCA TCGCGCCCTG TGATTTCGGG 
CTCGACTTCC ACACTTCCAC CCGCGGTCGA ACGAACATGC TCCACGTCCG CGGCGACATG 
ACCGACGACG GCGTTCACCG CCTCGCGTTG GCCTTCGGCT CGAAGGTGGT CATCGACAGC 
GACGGACCGA GCGGCACCCT CCGCGGCGAG GCGACCGCCG ACGGGATTCC CACGATCACG 
ATCGAGATGG GCGAGGCGCA CCGGTTCCAG CGCCCGCTTA TCGACGACGC GCTCGCGGGG 
GTACGCTCCG TCTTCGCCGA GTACAGCCTC TTAGATACCG ATACGGTGCG TTGGCCCGGC 
TGGCGGACGA TCGTCGCCGG TACGGGCGAG AAGACGTGGC TCCGGGCAGA CTCCGGCGGG 
ATCGTCGACA CCCACTTCGA GAGCGGCTCA CTCGTTCACG AGGGCCAGCG GATCGCGACG 
ATCACCAACC CGTTCAAGAA AGACGAGGTC GTGGTCGAAG CACCCTTCAC CGGCCTGCTG 
ATCGGCCTCC TAGAGAACCC GGTCGTTTAC CCCGGGAATC CGCTGTGTCA CCTCGTCGAG 
ATCGATGAAT CGACTCGGCG AGCGATCGAA GCCGGTGACG CCCCGGAGCC CGTCGGACAG 
CCGAACGCAG CGGAGTGA

Protein sequence

MSDERVFTYN GGAVPPGETQ NIRYGISETY LGDPVRIPVT IVNGERDGPT AFLMAAAHGD 
ELNGIEVVRE VAHEWDLSKL AGTLVCLPVL NVPGFLAQQR YLPVYDRDLN RSFPGKAGST 
SSKRMANQIY SNFIAPCDFG LDFHTSTRGR TNMLHVRGDM TDDGVHRLAL AFGSKVVIDS 
DGPSGTLRGE ATADGIPTIT IEMGEAHRFQ RPLIDDALAG VRSVFAEYSL LDTDTVRWPG 
WRTIVAGTGE KTWLRADSGG IVDTHFESGS LVHEGQRIAT ITNPFKKDEV VVEAPFTGLL 
IGLLENPVVY PGNPLCHLVE IDESTRRAIE AGDAPEPVGQ PNAAE