Gene Hlac_3007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3007
Symbol
ID	7398984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012028
Strand	+
Start bp	264921
End bp	266285
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	63%
IMG OID	643706817
Product	restriction endonuclease
Protein accession	YP_002564439
Protein GI	222475918
COG category	[V] Defense mechanisms
COG ID	[COG1715] Restriction endonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGTAC TGGACGATCT CTCGGGGTTC GAGTTCGAGG ATGTGATCGA GGACGTGTTC 
CGTAACCTCG GCTACGAGAA CGTCCGCCAG GCCGACCGCA CGGCTGACGA GGGTCGCGAT 
GTCCTTATGG AGGAGGTCGT CGACGGAACG CGGCGTGCGA TCATCGTCGA GTGTAAGCAC 
ACGGGGACGG TCGGACGCCC CGTCGTCCAG AAGCTCCACT CCGCCATAGC GACCTTCGAC 
TTCGACGGCC CCAAACGCGG GATGGTCGTC ACGACCGGCC GGTTTACGAA CCCTGCTCAG 
GAGTACGCAA ACCGCCTCCA GCAAAACGAC GACCCACACG CAATCGAACT GCTCGATGGC 
GAGGACCTCC GGGAGATCGC CGACGAGATC GGCCTCGACC TCTACAACGG CCGCATCGAG 
ATTCTCTGCG ACGAGACGCT ACGTCCCTAC GATCCGGCCG CCGACGTCGA CGCGGCCGTC 
GAGGTGGCAT TTCGCGACAT CGAGAACATC GAGAGCGCCG ACCTCCCGGA ACCACATTCG 
GCGGTGACGT TCCGCCCAGT GGTCGCGGTC ACCGCGGACA CGAACGCCGT CTTCGAGACG 
TCGGTGGGTG TCATCCACCG GATCAACGAC CGGACGCGGT TCGTCGTCCA CGCCGAACGC 
GGGCAGCCGC AGGTCGTCGA CGAAGACGTC GGGACGCTGG TCACCGAGAA CCTCCATGCG 
ACGGTCGATC TCGACGCCGA GCAGTTCGGA GCAGTGTTCG ACGACGTCGA GGAGAACCGG 
TTCGGCCAGA CGCAGACCGA GTACAAGGAG TGGGCCGTCG AGCGGCTCCA GCAGCACCAC 
ACGACGACGG TGACCTACAC CGGCGACAAC AACGTCACAT ACAACAAGAC CTGCGAGCCG 
AACCGCTCGG ACATCTCCGT CCAGACGATC GAGCCGGTGT ATCTCCCCGA GGTTCGGCAC 
ACCACTGACC TTCAGGAGTA CACCTATCCT TACGAGTACT ACGCAGCGGG TCCGTCCAGA 
GTGACCGCCG AGGACGGGAT CCATCGGTGC GTCCACTGTG ACACGAGCGG CGTCGACGAG 
CCGTACACGT ATTGTCCGAA CTGCGGGGCA ATCTCCTGCG ACAGTCATAG CAAGACCGAA 
CGGCTTGAGC AGGAGCCGGT GTGTACGGGG TGTGCGGTCA CCGAGCGATT TGCGTTGAAG 
ACGAAGTACT TCTACGACGA ACAGAACCTC AAGGCGTTCC GCGAGGAGTA CGCGGCGATG 
CCCCTCCACG AGAAAGCGAT GGAGAACAGG CTACTGGCCG GAGGGAGTGT GGTCGTGGCG 
CTTCTGGCGG TTATTGTCCT GCTCGCGGGT GGCGGCATCA TCTAA

Protein sequence

MAVLDDLSGF EFEDVIEDVF RNLGYENVRQ ADRTADEGRD VLMEEVVDGT RRAIIVECKH 
TGTVGRPVVQ KLHSAIATFD FDGPKRGMVV TTGRFTNPAQ EYANRLQQND DPHAIELLDG 
EDLREIADEI GLDLYNGRIE ILCDETLRPY DPAADVDAAV EVAFRDIENI ESADLPEPHS 
AVTFRPVVAV TADTNAVFET SVGVIHRIND RTRFVVHAER GQPQVVDEDV GTLVTENLHA 
TVDLDAEQFG AVFDDVEENR FGQTQTEYKE WAVERLQQHH TTTVTYTGDN NVTYNKTCEP 
NRSDISVQTI EPVYLPEVRH TTDLQEYTYP YEYYAAGPSR VTAEDGIHRC VHCDTSGVDE 
PYTYCPNCGA ISCDSHSKTE RLEQEPVCTG CAVTERFALK TKYFYDEQNL KAFREEYAAM 
PLHEKAMENR LLAGGSVVVA LLAVIVLLAG GGII