Gene Hlac_0002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0002
Symbol
ID	7399445
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2519
End bp	3616
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	64%
IMG OID	643707056
Product	Signal peptidase I-like protein
Protein accession	YP_002564678
Protein GI	222478441
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0681] Signal peptidase I
TIGRFAM ID	[TIGR02228] signal peptidase I, archaeal type

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.756287
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAAG GGGACCGGTC GGACGGCGGC GACGAACCCG ACCGGAAGAC CGGATCGGCA 
GACAGCGATC CCGTCAACGA CGGCGATTTC AGCGGCGACG ACGGAAACGG CGGCGACCAG 
TCGGTTTCCA AAGAGGATTG TGAGACGGGT CCCGGGGAAA GTTCTGAAAC AGGTTCTGCG 
GACACCGAGA CACCGAGTGA CGAACGCGGC CGAGCCTCCG ACGATCGGAT CGAAACTGGT 
CAGGCCGGAT CAAAACCAAG TCGAGGGAGG GGTGAAACGG GACGAGACCG AACCGAAACG 
GACCGAGACT CGAATTCTTC CGGCAAAGGG GTCCTGTACC GGTTCCGTCA CAACAGAGAG 
GGGCCGCTGA TGTGGATCCG GGAAATGCTC TCCAGCGTGG CCATCGTGCT TGTGATCGGC 
CTGATCCTGT TCGGCGTCAG CGGCGTGTGG CCGCCGATGG TCGCGGTCGA GTCCGGGAGC 
ATGGAGCCGA ACATTGAGGT TGGTGACCTC GTCTTCGTCA CGGAGCCGGG GCGACTTGCA 
CCCGACGCCG CGGACAACGA CATCGGTGTC GTGACTCACG AGGTCGGGGA GACCGCTGAC 
TACCAGACGT TCGGGTCCTA CGGCTCGGTG GTGATCTACC GACCACCGGG ACGGACGACT 
TCGCCGATCA TCCATCGGGC GATGTTTCAT GTGGAGGAAG GCGAAAACTG GCACGACCGC 
GCCGACGATC GGTACCACAA CGCCGCCGAC TGCGGGGAAC TCAACCACTG TCCCGCACCC 
CACGACGGAT TCATCACGCT CGGCGACAAC AACGGCGAGT ACGATCAGGC GAACGGGCTC 
GCCGCGCCGG TCAAGGCCGA CTGGGTGACC GGAGTCGCGC GGGTCCGTGT GCCGTACCTC 
GGCTACGTGC GACTGATCAC GACCGGCCAG GCGGATCTGA GTGACGTGTT GGCGACGAGC 
GTCGTGATGC AGACTGGAGG GGTCGGCGCC GACGCCGACG GAGTCAGTAG TGGAAGTGGA 
TCTAGCGAGA AGATCACCGT TCCTGACGCG AAGCCCATCG TTTCGGGTGG AGAGGTAACC 
GCGGAGGCCG TCGCTTAA

Protein sequence

MDEGDRSDGG DEPDRKTGSA DSDPVNDGDF SGDDGNGGDQ SVSKEDCETG PGESSETGSA 
DTETPSDERG RASDDRIETG QAGSKPSRGR GETGRDRTET DRDSNSSGKG VLYRFRHNRE 
GPLMWIREML SSVAIVLVIG LILFGVSGVW PPMVAVESGS MEPNIEVGDL VFVTEPGRLA 
PDAADNDIGV VTHEVGETAD YQTFGSYGSV VIYRPPGRTT SPIIHRAMFH VEEGENWHDR 
ADDRYHNAAD CGELNHCPAP HDGFITLGDN NGEYDQANGL AAPVKADWVT GVARVRVPYL 
GYVRLITTGQ ADLSDVLATS VVMQTGGVGA DADGVSSGSG SSEKITVPDA KPIVSGGEVT 
AEAVA