Gene Hlac_0001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0001
Symbol
ID	7401478
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	780
End bp	2453
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	61%
IMG OID	643707055
Product	orc1/cdc6 family replication initiation protein
Protein accession	YP_002564677
Protein GI	222478440
COG category	[L] Replication, recombination and repair [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1474] Cdc6-related protein, AAA superfamily ATPase
TIGRFAM ID	[TIGR02928] orc1/cdc6 family replication initiation protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.810382
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAAG GAGAGAACAC ACCGCAGGCC GATGAATCGA AAGACAACAG CGGGATAACC 
GGCGATCGGT CCGGGACTGA CCAGGTTGAC GAAACCGACG GATCCGACGA AACCGACGCT 
AACCTCGACG ATCCGCCATC ACCCGGCTCG ACGAACTCTG ATTTAAACAC GGATCTACAG 
TCGGATCCCG AAACTGACGT TTCCACGGAC ATCGATGTCG GAAGCGGCGG ACGAGACCGC 
TCCTCTCCGG ATGTCGACTT CGACGGTGTC GTCCTCGACG ACGACGACGA CAACCAGGGT 
CTGTTCGACG ATCTGCTCTC CGGAGAGCCG ATATTCGAGA ATAAAGAGGT CCTCCGTCCC 
TCCTACACTC CCCACGAGCT TCCCCACCGA AACGACCAGA TCAATCGGAT GGCGACGATC 
CTCGTCTCCG CGCTGCGCGG GGAAACGCCC TCTAATATCC TCATTTACGG CAAGACGGGA 
ACGGGGAAGA CGGCCTCCGC GAAGTTCGTC TCCCAAGAGC TTGAGTCCAC CTCACAGAAA 
TACGACGTAC CCTGCGAGGT CGAGTACATT AACTGCGAGG TGACGGACAC GCAGTACCGC 
GTCCTCGCGC AGCTCGCGAA CACCTTTATC GAGAAGAACC AGGCGGTCAT CGCGGACCAA 
CTGGAGCGGT GTCGCGAACT CCGCTCTGCC GCCGCCGACG CTCCAGCCGC CCTCGCCGAC 
ACCGAGTTCG CAACGCTCGA CGACCTCGAC GCGCGAATCG ACGAGCTCGA AACCGATGCC 
GAAGAGATGG AGGAGGTCCC CATGACTGGC TGGCCCACCG ACCGGGTCTA CTCGACCTTC 
TTCGAGGCAG TCGACTACCA CGAGCGCGTG GTTGTTATCA TGCTCGACGA GATCGACAAG 
CTTGTCGAGA AGAGCGGGGA CGACACCCTC TATAACCTCT CTCGGATGAA CTCGGAACTC 
AACAGGTCCC GGATCTCGAT CATGGGGATC TCGAACGATC TGAAATTCAC CGATTTCCTC 
GACCCCCGTG TCAAGTCGAG CCTTGGCGAG GAAGAGATCG TCTTCCCGCC CTACGACGCG 
AACCAGCTCC GCGACATCCT CCAGCACCGC GCCGATATTT CGTTCAAGCA GGACGCGCTC 
ACGGACGACG TGATCCCCCT CTGTGCGGCG TTCGCCGCTC AGGAACACGG CGACGCCCGT 
CGCGCGCTCG ATCTACTCCG TACTGCGGGC GAACTCGCCG AGCGCTCGCA GGCTGAGATC 
GTCGCCGAGA AACACGTCCG GCAGGCGCAG GACAAGATCG AACTCGACCG CGTCGTCGAG 
GTTGTCCGCA CCCTCCCGAC CCAGAGCAAG ATCGTGCTGT TCGCGGTCAT CCTCTTGGAG 
AAGAACGGCG TGCACAACAT CAACACTGGC GAGGTATTCA ACATCTACAA ACGCCTCTGC 
GAGGAGATCG ACGCCGACGT GCTCACCCAG CGCCGCGTCA CCGACCTCAT CAGCGAACTC 
GACATGCTCG GGATCGTCAA CGCCGTCGTC GTCTCGAAGG GGCGCTACGG CCGGACCAAG 
GAGATGGGCC TGTCGGTTCC CGTCGAGGAG ACCGAGGCCG TCTTGCTGTC CGACTCCCGA 
CTCGGCGACA TCGAGAACGC GCAGCCGTTC GTCCAGGCCC GATTCGACAA CTGA

Protein sequence

MDEGENTPQA DESKDNSGIT GDRSGTDQVD ETDGSDETDA NLDDPPSPGS TNSDLNTDLQ 
SDPETDVSTD IDVGSGGRDR SSPDVDFDGV VLDDDDDNQG LFDDLLSGEP IFENKEVLRP 
SYTPHELPHR NDQINRMATI LVSALRGETP SNILIYGKTG TGKTASAKFV SQELESTSQK 
YDVPCEVEYI NCEVTDTQYR VLAQLANTFI EKNQAVIADQ LERCRELRSA AADAPAALAD 
TEFATLDDLD ARIDELETDA EEMEEVPMTG WPTDRVYSTF FEAVDYHERV VVIMLDEIDK 
LVEKSGDDTL YNLSRMNSEL NRSRISIMGI SNDLKFTDFL DPRVKSSLGE EEIVFPPYDA 
NQLRDILQHR ADISFKQDAL TDDVIPLCAA FAAQEHGDAR RALDLLRTAG ELAERSQAEI 
VAEKHVRQAQ DKIELDRVVE VVRTLPTQSK IVLFAVILLE KNGVHNINTG EVFNIYKRLC 
EEIDADVLTQ RRVTDLISEL DMLGIVNAVV VSKGRYGRTK EMGLSVPVEE TEAVLLSDSR 
LGDIENAQPF VQARFDN