Gene Hlac_3083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3083
Symbol
ID	7399054
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012028
Strand	-
Start bp	338222
End bp	339622
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	62%
IMG OID	643706887
Product	type III restriction protein res subunit
Protein accession	YP_002564509
Protein GI	222475988
COG category	[K] Transcription [L] Replication, recombination and repair
COG ID	[COG1061] DNA or RNA helicases of superfamily II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGTCG AATTCGACGA CGGGACGCTC CTGCTCCGTA ATGCTCCTGA CGATGTTCCC 
TATGGGGAGT GGGACGACCG CGTCGACGAG TACCGAACGC GAGCATATCG ATATCGAGCC 
CTGCTCGAGT GGGCCGGTAA GTGGACGGAC GGAAACGAGC AGGCAACGTT GCAAGAAGGC 
TTCGCTCACA CTCTCGAAGA CACCGCGCGG GCCTACCCCG ATCTCGATCT CACGCAAGCG 
CTCCACATCG AACCGCGTGA CTACCAGCAA GCGGCGCTCG ACGCCTGGAT CGACCACGAT 
CGGCGAGGGA GTGTCGTACT CCCCACGGGC AGCGGGAAGA CGTTCCTCGG GCTGCAGGCC 
ATCGCCGACG CTGGCGTCAG TACTCTCGTC GTGACGCCGA CGATTGACCT CATGAACCAG 
TGGCACGCCA CGCTCACCAA CGCCTTCGGC GACCAACTCA CGGAACCGGT CGGCGTCCTC 
GGCGGCGGCA GCCACGACGT CACCGCGATC ACCGTCACCA CCTACGACAG CGCCTACCGC 
TACGTCAACG AGTACGGCGA TCAGTTCGGC TTGCTCGTCG TCGACGAGGA ACACCACCTG 
CCAGCCCCGA CCTACCGGCA GATCCCCGAG ATGATTATCG CCCCGTATCG CCTCGGGCTG 
ACCGCCACCT ACGAGCGGCC CGATGGTAAG CACGAACTTC TTGAGGACCT CCTCGGCCCG 
GTCGTCTACC GGAAGGACGT CGACGAACTC GCCGGCGAAT ACCTCAGCGA GTACGAAACG 
ATCCACATGT CGGTCGACCT CACGGCTGAC GAACGTGAGG AGTACGACGA GGAGTACCAG 
ATCTATCGCG ACTACGTCGA CAGCCACGAG TTTGACCTCT GGAAAGAGGA CGGCTACGCA 
GAGTTCCTCA AACGCACGTC CTACGACCCG CAAGGGCGGC GGGCGCTCAT CGCCAAGCAA 
CGTGCCGAGC GAATCGCCCG AACCGCCGAA AAGAAACTCG ACACGCTCGA CAACCTATTG 
AAACGTCATC ACGATGATCG AACAATTATT TTCACCGCCA ACAACGACTT CGCCTACGAC 
ATCTCCCGGG AGTTCATCGT CCCCTGTATC ACTCACCAGA CCAAGACTGA CGAACGCACC 
GAAATCCTCG ACCGCTTCCG GAGCGGGGAG TACTCGATGC TCGTCACGTC ACAGGTGCTC 
GACGAGGGCA TCGACGTCCC GGCGGCAAAC GTCGGGATCA TCCTCTCGGG GAGCGCCTCG 
AAACGCCAGT ACGCGCAACG GCTTGGCCGC ATCCTGCGAC CCACGGACGA CCGCCAGCCC 
GCGCGGCTCT ACGAGATCAT CACCGAGGAT ACGATGGAGA CGTACGTCTC CCAACGCCGC 
CGTGAGGGGG TGAGTGCGTA G

Protein sequence

MQVEFDDGTL LLRNAPDDVP YGEWDDRVDE YRTRAYRYRA LLEWAGKWTD GNEQATLQEG 
FAHTLEDTAR AYPDLDLTQA LHIEPRDYQQ AALDAWIDHD RRGSVVLPTG SGKTFLGLQA 
IADAGVSTLV VTPTIDLMNQ WHATLTNAFG DQLTEPVGVL GGGSHDVTAI TVTTYDSAYR 
YVNEYGDQFG LLVVDEEHHL PAPTYRQIPE MIIAPYRLGL TATYERPDGK HELLEDLLGP 
VVYRKDVDEL AGEYLSEYET IHMSVDLTAD EREEYDEEYQ IYRDYVDSHE FDLWKEDGYA 
EFLKRTSYDP QGRRALIAKQ RAERIARTAE KKLDTLDNLL KRHHDDRTII FTANNDFAYD 
ISREFIVPCI THQTKTDERT EILDRFRSGE YSMLVTSQVL DEGIDVPAAN VGIILSGSAS 
KRQYAQRLGR ILRPTDDRQP ARLYEIITED TMETYVSQRR REGVSA