Gene Hlac_2601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2601
Symbol
ID	7399827
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	2578912
End bp	2580096
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	67%
IMG OID	643709674
Product	peptidase M50
Protein accession	YP_002567243
Protein GI	222481006
COG category	[R] General function prediction only
COG ID	[COG1994] Zn-dependent proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.603215
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.812434
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGGAA TCAAGATCGG GACGGTGCTG GGGATCCCGG TCAGGCTCAA CTGGACGTTT 
CTGATCGTAC TGCCGCTTTT CGCCTACCTC ATCGGCTCGC AGGTCGGGAT GATCGCCGAG 
GTGATGAACG AGGCGTTCAG CGCCGGCATC GACCCCGCCG CGCTCGGTGC GGGGCTCACG 
CCGTGGGCAC TCGGGTTGGC GGCCGCACTC GGGCTGTTCG GCGGCGTCCT CCTCCACGAG 
TTCGGCCACT CGATCGTCGC CATGCGGTAC GGGTACGAGA TCGAGTCGAT CACCCTGTGG 
CTGCTCGGCG GGATCGCCAG CTTCACCGAG TTCCCCGAGG ACTGGAAACA CGAGTTCTGG 
ATCGCGATCG CGGGACCGGT CGTCAGCGTC GCCGTCGGGC TCGTCTGTTA CGGCGTGTTC 
GTGCTCGCGC CGCTCGGCTC GAACGCCGTG TTGTTCGTCT TCGGCTACCT CGCGCTGTTG 
AACATCGTGC TCGCGGTGTT CAACATGCTT CCCGCCTTCC CGATGGACGG CGGGCGCGTC 
CTTCGGGCGC TCCTCGCGCG GAACCAGCCG CACGCGCAGG CGACCCAGCG CGCAGCCGCG 
ATCGGGAAGG TGTTCGCCTT CTTCATGGGA CTGATCGGAC TGTTCACCTT CCAGCTCCTG 
CTGATCGTGT TGGCCTTCTT CATCTACATC GCCGCCTCCG GCGAGGCCCA GCAGACGACG 
CTGAAGGCCG CCTTCGAGGA CGTCACCGTC GCCGACGTGA TGACCCGCCG CGAGGACCTC 
CACACCGTCA CCGGAGACAC CTCTGTCGCG GATCTGATGA GCCGGATGTT CGAGGAGCGC 
CACACCGGCT ACCCCGTGCT CCACGGCGGC AACCTCGTCG GGATGGTGAC CTTAGAGGAC 
GCCCGATCGG TCCGGGATGT CGAGCGGGAC GCCTACCAGG TCGCAGACGT GATGGAGACC 
GAAGTGGTCG GCGTCGGTCC CGAGGCCGAC GCGATGACCG CGCTCCAGAC GATGCAGGAG 
AACGGCGTCG GCCGGCTCCC GGTCGTCGAT CGGAGCGACG AGCTGGTCGG ACTCATCTCC 
CGTTCGGACC TGATGACCGC GTTCAACATC ATCCAGACGG GTGGCACTCC GAGCCTCATC 
AGCGGACGCC GACAGGGGGC CGAAGGCGGC CCCGGCGTGT TCTGA

Protein sequence

MRGIKIGTVL GIPVRLNWTF LIVLPLFAYL IGSQVGMIAE VMNEAFSAGI DPAALGAGLT 
PWALGLAAAL GLFGGVLLHE FGHSIVAMRY GYEIESITLW LLGGIASFTE FPEDWKHEFW 
IAIAGPVVSV AVGLVCYGVF VLAPLGSNAV LFVFGYLALL NIVLAVFNML PAFPMDGGRV 
LRALLARNQP HAQATQRAAA IGKVFAFFMG LIGLFTFQLL LIVLAFFIYI AASGEAQQTT 
LKAAFEDVTV ADVMTRREDL HTVTGDTSVA DLMSRMFEER HTGYPVLHGG NLVGMVTLED 
ARSVRDVERD AYQVADVMET EVVGVGPEAD AMTALQTMQE NGVGRLPVVD RSDELVGLIS 
RSDLMTAFNI IQTGGTPSLI SGRRQGAEGG PGVF