Gene Hlac_1556 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1556
Symbol
ID	7401488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1576225
End bp	1577637
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	70%
IMG OID	643708622
Product	type III restriction protein res subunit
Protein accession	YP_002566213
Protein GI	222479976
COG category	[K] Transcription [L] Replication, recombination and repair
COG ID	[COG1061] DNA or RNA helicases of superfamily II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGTCC GGCTGACCTA CGAGGACGGG ACGATCCGGG TCGTCGCTGG CGACGCCACT 
GGCAACGGTG CGAACGATGC CGACGGCGAC GCTCTGGAGT CGCTCCCGCC GCTCCCCGGC 
GTCGAGAGCG ACCCGCGATC GGGGACCGGG CGCGCCCCGG CCTACCGCTA CGCCGCGATC 
CGACGAGCCT TGGAGGTCGC CGGCGTGAGC GTCGAGGATC ACGTGCTGGA CGCGAGCGAC 
CGCGCGGGAG CGGCAGCCGG GCTCGACACC GGCCTTTCGA CCGACTACGA TCTCCGGGAG 
TACCAGCGTG AGGCGCTCGA CGCGTGGCGC GACGCCGGCG ACCGCGGCGT GCTCGAACTC 
CCGACCGGGG CCGGCAAGAC CGTGATCGCA ATACGCGCGA TGGTCGAGCT AGGCGTGCCG 
ACCCTCGTCG TAGTGCCCAC GGTCGATCTC CTCAATCAGT GGCAGCGGGA GCTAGAAGCG 
GAGTTCGACG TACCAATCGG GCGGTTCGGC GGCGGCGAAC AGCGCCAAGA GGCGATCACG 
GTGTCGACGT ACGACTCTGC GTACCTGAAA GCCGAGGATA TCGGCGACGC CTTCGAGTTC 
GTCGTCTTCG ACGAGGTCCA CCACCTCGGC GGCGAGGGGT ATCGTGACGT GGCGCGGCTG 
CTCGCGGCGC CCGCCCGGCT CGGGCTCACC GCCACCTTCG AGCGCCCCGA CGACGCGCAC 
GAGACCGTCG CAGAGCTGAT CGGCGACCGC GTGTACGCGC TCGACGTGGA CGACCTCGCG 
GGCGACCACC TCGCCTCCTA CGACATCCGA CGGATCGAGG TGGAGCTGAC GCCCGACGAG 
CGCGAGCGCT ACGACGCGAA GCAGGGCACC TTCGTCGAGT ACGTCCGGGA CGCGGGGATC 
ACGTTCACGA GCGGGAGCGA CTATCAGGAA CTCGTCAAGC GCTCCGGCAA CGACCCGGCC 
GCGAGGGAGG CGCTCCTCGC GAAACAGGAC GCCCGCGAGA TCATGATGAA CGCGCGCCGG 
AAGATCGACC GCTTGGAGTC GATCCTCGAC CGCCACCGCG ACGACCGCGT GATCGTGTTC 
ACCGCCCACA CCGACCTCGT CTACCGGCTT TCCGAGCGAT TCCTGCTGCC CGCGATCACC 
GCCGAGACGG GCGCGAAGGA GCGCCGCGAG ATTCTGGAGC GCTTCCGCGA GGGGACCTAC 
GGTCGGGTCG TCGCCGCCAA CGTCCTCGAC GAGGGCGTCG ACGTGCCCGA CGCGAACGTC 
GCGGTCGTGC TCTCCGGCTC GGGGAGTGAA CGAGAGTTCA CCCAGCGGCT CGGGCGGGTG 
CTCCGTCCCA AAGACGACGG TGGGCGGGCG ATCCTCTACG AGGTCGTCAG CACGGAGACC 
GCGGAGGAGC GGGTGGCGAG CCGGCGGCGG TGA

Protein sequence

MDVRLTYEDG TIRVVAGDAT GNGANDADGD ALESLPPLPG VESDPRSGTG RAPAYRYAAI 
RRALEVAGVS VEDHVLDASD RAGAAAGLDT GLSTDYDLRE YQREALDAWR DAGDRGVLEL 
PTGAGKTVIA IRAMVELGVP TLVVVPTVDL LNQWQRELEA EFDVPIGRFG GGEQRQEAIT 
VSTYDSAYLK AEDIGDAFEF VVFDEVHHLG GEGYRDVARL LAAPARLGLT ATFERPDDAH 
ETVAELIGDR VYALDVDDLA GDHLASYDIR RIEVELTPDE RERYDAKQGT FVEYVRDAGI 
TFTSGSDYQE LVKRSGNDPA AREALLAKQD AREIMMNARR KIDRLESILD RHRDDRVIVF 
TAHTDLVYRL SERFLLPAIT AETGAKERRE ILERFREGTY GRVVAANVLD EGVDVPDANV 
AVVLSGSGSE REFTQRLGRV LRPKDDGGRA ILYEVVSTET AEERVASRRR