Gene Hlac_1745 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1745
Symbol
ID	7399616
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1759291
End bp	1760337
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	69%
IMG OID	643708812
Product	aspartate-semialdehyde dehydrogenase
Protein accession	YP_002566397
Protein GI	222480160
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0136] Aspartate-semialdehyde dehydrogenase
TIGRFAM ID	[TIGR00978] aspartate-semialdehyde dehydrogenase (non-peptidoglycan organisms)

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.405709
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGTAC GAGTCGGCAT CCTTGGCGCC ACCGGCGCCG TGGGACAGCG GTTCATCCAG 
TTGCTCGACG ACCACCCGAC CTTTGACCTC GCCGCGGTCA CCGCCAGCGC GGACAGCGCG 
GGCAAGACCT ACCGCGAGGC CGCCAAGTGG CGCGTGGACA CACCCATCCC GGACGACGTC 
GCCGAGATGG AGGTCACGGA GACGACGCCC GCGGGAATCG CGGACGCCGA CGTGGACCTC 
CTCTTCTCGT CGCTCCCCTC GGGTGTCGCG AGCGAGGTCG AGCCCGCGTT CTTGGAGGAG 
GGATACGTCG TCTCCTCGAA CTCATCGAAC GATCGCATGG CGGCCGACGT GCCGCTGACG 
ATCCCCGAGA TCAACCCCGG TCACCTCGAC CTGATCGAGG TCCAGCGCGA CGAGCGCGGC 
TGGGACGGCG CCCTCGTGAA GAACCCGAAC TGCTCGACGA TCACGATGGT CCCCACCCTC 
GCAGCGATCG ACGAGTTCGG CTTGGAGAGC GTCCGGGTCT CGACCCTGCA GGCGGTCTCC 
GGCGCCGGCT ACTCCGGCGT TACCTCGATG GAGATCATCG ACAACGCCAT CCCGCACATC 
GGCGGCGAGG AGGAGAAGAT GGAGACGGAG TCGCGCAAGC TTCTCGGCGA ATTCGACGGC 
GCGGAGGTCC ACCTCCACGG CGCCGACGTG GCCGCCTCCT GTAACCGGAT CCCGACGCTC 
GACGGTCATC TTGAGAACGT CTTCGCCGAG TTCGCCGAGG ACCCGTCGCC CGCTGACCTC 
CGCGAGGCAA TGCGCTCGTT CGAGGGCGCC GCCGCGCTCC CCAGCTCGCC CGACCAGCTC 
ATCAAGGTGT TCGGCGAGGA CGAGCCGGAG CGCCCCCAGC CCCGCCTCGA CCGCACGTAC 
GCGGGCGGGA TGGGCATCGT CGCCGGCGGC GTGCAGGCGA CGAACGCCGG CATGAAGTAC 
AACTGCCTCG CGCACAACAC GATCCGCGGC GCGGCGGGCG CCTCGCTGCT CAACGGCGAG 
CTGCTCGTCG AGGAAGGGTA CGTCTAA

Protein sequence

MSVRVGILGA TGAVGQRFIQ LLDDHPTFDL AAVTASADSA GKTYREAAKW RVDTPIPDDV 
AEMEVTETTP AGIADADVDL LFSSLPSGVA SEVEPAFLEE GYVVSSNSSN DRMAADVPLT 
IPEINPGHLD LIEVQRDERG WDGALVKNPN CSTITMVPTL AAIDEFGLES VRVSTLQAVS 
GAGYSGVTSM EIIDNAIPHI GGEEEKMETE SRKLLGEFDG AEVHLHGADV AASCNRIPTL 
DGHLENVFAE FAEDPSPADL REAMRSFEGA AALPSSPDQL IKVFGEDEPE RPQPRLDRTY 
AGGMGIVAGG VQATNAGMKY NCLAHNTIRG AAGASLLNGE LLVEEGYV