Gene Hlac_0202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0202
Symbol
ID	7402131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	217406
End bp	218704
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	73%
IMG OID	643707265
Product	peptidase M24
Protein accession	YP_002564877
Protein GI	222478640
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.736579
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACGACG GGAGCGACGA CGCCGATTCG CGCGATCGTC TCCCGCTCCG CACCGATCTC 
ACCCCGATCG TCGAGGCGGT CGCGGCCGCG GACGCCGACG CGTTCGTCAC GGTCGGCGAT 
CGGTTCGACG ACGACCTTCG GTACCTCACG CGCTTTTCCG GGCCGGACCG AGCGTACGCG 
CTGGTGATCG TTCCGGCCGA CGACGCCGGG GGCCGCGCCG TCTGCTGTGC CCCGTCGCTG 
TTCCGCGAAC AGGCCGAACG TGAGTTCGTC GCGAGCGCGC GCAGTCGAAG TGCCGACGAC 
GGCGGTTTCC ACGACGGCGT CGCTCGCGAG GTACGGACCG AGCGCGTCGG CAACCACGCT 
GGCGAGCGCG CGGCGGCGGT CATTCGCGAC CTGCTCGGCG GCGAGGACAG CGAACCCACC 
CTGCTCGTCC CCCCGTCGAT CCCGCACGAC GCGGCGGTGT ACCTGGAACG CGCCGGCAAC 
GCGCTCGCGT CGACCAACGC GGTCGCGAGG GCGCGAGCGC GGAAGACCGA CGCCGAGATC 
GACCGGCTCC GCCGCGTCCA GTGCGCGGCG GTCGCGGGGA TGGCACGCGC GGAGACCATG 
TTGGCTGAAA GCGAAGTCGT CGAGGTGGAA TCCGTCGAGG ATACCGACAC AGAACGCAGG 
CCCGCCCTCC GCTGGGAGGG CGCCCCCCTG ACGACCGAGC GGCTGCGGCG AGCGGTGAAC 
GCGACGCTCG CCGACCGCGG CGTCCGCGAC GCCGGCGACA CCGCGATCGG CGCCGGCCCG 
TCGGCGGCCG ACCTCCACTA CGTCGGCGAC GACCCGATCC GGCCGGGCGA GACGGTGCTG 
ATCGACATCT CGCCGCGCGG GCCCGACGGG TACCGCGGCG ACCTGACCCG GACGTTCGTC 
GTCGACGGCG ACGGCGGCTG GGAGCGTCGG GCGTACCTCG CGGTCGAGTC GGCCCGAGAG 
GCCGCGCTCG CCGAGATCGA GCCGGGCGTC CCGACTAAGA CCGTCCACGG CGAGGCCGCC 
GCCGAGCTGG CCGCGTACGG GTTCGACCCG AACGCGGGGG AGGGCGAGGC CGGGTTCACT 
CACGGCGCCG GCCACGGCGT GGGAGTGAGC CTCCACGAGT CGCCGTCGCT GTCGGGTGCG 
GGCGAACTGC GACCGGGCCA CGTCGTCACG GTCGAGCCCG GCGTCTACGA CCCGGACGTC 
GGCGGTGTCA GACTGGGGGA CCTCGTCGTC GTCACCGAAG ACGGGTACGA GGTGCTGGCC 
GAGTACCCGT TCGGGATCGT GCCGAACGAG CGCGAGTGA

Protein sequence

MNDGSDDADS RDRLPLRTDL TPIVEAVAAA DADAFVTVGD RFDDDLRYLT RFSGPDRAYA 
LVIVPADDAG GRAVCCAPSL FREQAEREFV ASARSRSADD GGFHDGVARE VRTERVGNHA 
GERAAAVIRD LLGGEDSEPT LLVPPSIPHD AAVYLERAGN ALASTNAVAR ARARKTDAEI 
DRLRRVQCAA VAGMARAETM LAESEVVEVE SVEDTDTERR PALRWEGAPL TTERLRRAVN 
ATLADRGVRD AGDTAIGAGP SAADLHYVGD DPIRPGETVL IDISPRGPDG YRGDLTRTFV 
VDGDGGWERR AYLAVESARE AALAEIEPGV PTKTVHGEAA AELAAYGFDP NAGEGEAGFT 
HGAGHGVGVS LHESPSLSGA GELRPGHVVT VEPGVYDPDV GGVRLGDLVV VTEDGYEVLA 
EYPFGIVPNE RE