Gene Hlac_3448 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3448
Symbol
ID	7402294
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	+
Start bp	197906
End bp	199165
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	67%
IMG OID	643709989
Product	peptidase M20
Protein accession	YP_002567555
Protein GI	222481319
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCACA CACGGACAGA CGTTCAGCGG ACCGACGACC GCCGAAATCG GCTCGCCGAG 
ACGACGCTCG AGTTGCTCGC GTTCGACACA CAGAACCCAC CCGGCGAGAC CCGACAGGCG 
TTCGACTGGC TCGAGCGCTC CGTCCCGGAA CGTGGTGTCG AGATCGATCG GATAGAAGCC 
GAACGCGAGA AACCGAACCT CGTCGTGACC ATCCCCGGCG AGCGCGAGTG GACGCTGCTC 
TACGAGGGCC ACCTCGATAC CGTCCCCTAC GACCGGGACT GCTGGTCGCA CGATCCACTG 
GGCGATCGCG TCGACGACCG GCTCTACGGC CGCGGTGCGA CCGACATGAA GGGTGCGGTC 
GCAGCGATGC TCGAAACGAT GCGGACGTTC GCCGACGAGA CGCCGCCGGT GACCCTGCAG 
TTCGCGTTCG TCAGCGACGA GGAGACCGGT GGGGGCGCGG GAATCGACGC CGTGCTGGAC 
GCCGAGGCGA TCAGCGCCGA CGCCGCAGTG GTCGGCGAGA CGACCTGCGT CGACGAACGC 
CACTCGATCG CTGTCGCCGA CAAGGGTCGA ATCTGGCTCA CGCTCGAGGC GACCGGGCGG 
GCCGCCCACG GCTCCCGGCC GATGAACGGC GAGAACGCGA TCGATTACCT CTACTCGATG 
ATCGATTCCT GTCGGGAATC GATTACGTCC CGTCGGCTGG AGTACGATCC GGCGGTCGAA 
CGGATCCTCG AGGAGTCTCG GGCATACTAC GGGTCTTGTC CGTGCGAGGC TGGGACACAC 
CTCGAAGAGC TCTTCGAGTA CCCCACGTTC AACCTCGGGC GTCTGGACGG CGGCAACACC 
GTCAACAGCG TCCCCCAGAC TGCGACCGGC GAACTCGACG TTCGGGTGAC GCCGGGAGCC 
TCTACCGGGG CGGTTCTGGA GCAGATCCGG ACGTGTATCG ACGGCCGGGA GCACGTCTCG 
ATTCGGGACG TCTCCTGGGC CGAGGGAACC TACGTCGAAC CGTCCGCTCC GATCGTCGAG 
GCCGTCACCA CGGCGGCCGC GGACGTCCTC ACGGATCGGC CGCTTGCCCG CTGTGCGACC 
GGTGGTGGCG ACGTCAAGAA GCTCCGGGCG GCGGACGTTC CCGCAGTCGA GTGTGCAATC 
GGGAGCGATA CCGCCCACGG TGTCGACGAG TACGTCCCGA TCGACGCGCT CGAACGCACG 
GCTAAGTGGT ACGTGCGGCT ACCGGGCCAG CTCGCCGAGT CGATCGGGTC CAAGCGCTAG

Protein sequence

MNHTRTDVQR TDDRRNRLAE TTLELLAFDT QNPPGETRQA FDWLERSVPE RGVEIDRIEA 
EREKPNLVVT IPGEREWTLL YEGHLDTVPY DRDCWSHDPL GDRVDDRLYG RGATDMKGAV 
AAMLETMRTF ADETPPVTLQ FAFVSDEETG GGAGIDAVLD AEAISADAAV VGETTCVDER 
HSIAVADKGR IWLTLEATGR AAHGSRPMNG ENAIDYLYSM IDSCRESITS RRLEYDPAVE 
RILEESRAYY GSCPCEAGTH LEELFEYPTF NLGRLDGGNT VNSVPQTATG ELDVRVTPGA 
STGAVLEQIR TCIDGREHVS IRDVSWAEGT YVEPSAPIVE AVTTAAADVL TDRPLARCAT 
GGGDVKKLRA ADVPAVECAI GSDTAHGVDE YVPIDALERT AKWYVRLPGQ LAESIGSKR