Gene Hlac_1085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1085
Symbol
ID	7400157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1085512
End bp	1086711
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	58%
IMG OID	643708151
Product	orc1/cdc6 family replication initiation protein
Protein accession	YP_002565750
Protein GI	222479513
COG category	[L] Replication, recombination and repair [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1474] Cdc6-related protein, AAA superfamily ATPase
TIGRFAM ID	[TIGR02928] orc1/cdc6 family replication initiation protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.666942
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGGGC CATTCAGTGA TATCGAGCGT TCGATTTTTG TCTCGAAGGA AGTTCTCTCC 
GAAGATCATC AGCCTGATCA GATTCTCGAA CGCGACGAGG AGATCGATCA ATACCGCCAC 
GCGCTTCAAG ATGTTCTCTT CGGTCGCACC CCACAGAACG TCATGCTGTA CGGGAAGGCC 
GGGCTCGGCA AAACCGCTGT CACGACGTAT ATGATGGAGG CGCTTCAAGA CGAGGTCACG 
AAGCGACCGG ACGCCGACGA CGTACACGTA CACGAATTGA ACTGTAACGG AAAGTCTCTC 
TACACTGTCG TTCGCACTCT GGTCAACGGA CTGTTACCCG AGCATGCAAG CGAGTTCCCG 
AAACGTGGTC TTGGAACGGC TGACGCCTTC GAGGAACTCT ACACTCAACT TGACCGAATC 
GGCGGAACTC ACCTCGTCGT CTTCGACGAG ATTGATCACT TGGACGATGT CGACACCCTC 
CTGTATGAAC TCCCGCGAGC GCGATCGATC GGTCACATCA CGAACTCGAA GGTCGGAGTC 
ATCGGAATCA GTAACAACTA CACGTTTCGG CAGTCGCTCT CGCCGAAGGT GAAAGACACG 
CTGATGGAGA CAGAGATATC GTTCAGCCCG TACGATGCGA GCGAGCTCCG TACAATTCTC 
GCGGACCGTG CCGATCGGGC GTTCGTAGAA GGTACCTGTG ACGACTCGGC CATCGCGAGG 
GCGGCGGCGA TCGCGGCCAA GGATCGCGGA AACGCGCGCC AAGCGATAGA TCTCCTCCGT 
GTCGGCGGCG AAGTCGCCAC ACGGGGTGAC GACGAACGGG TCGACGACTC ACACATCGTC 
AAAGCCCAAG AACTCGTGCA GCGGGGACGA TTGCGGAACC GCATTCGAGA TCAGACACAG 
CACGCACAGC TCCTGCTCGA AACCGCGGCG TACATCGAAC AACAAGGGGA GTCACCGGCA 
CGGTCGAGAA CGATCAAGGA CCGATACGAG GCGGTCGCCG AATCACACGC TGTGGATCCA 
CTTACGACCC TTAAGAGCAT CCAGAACCAT CTCTCTGACC TCCACATGCT CGGGTTTCTG 
CAGCGGAGAG ACCGAAATCA CGGCGAAGGC GGCGGTCGGT ACTACGAGTA CCAACTCGAC 
CTCGATCCGC AGATCGTCGT CGAAATCCGA CAGGAGGCCG AAGCCAAACC CTCCCCATAA

Protein sequence

MAGPFSDIER SIFVSKEVLS EDHQPDQILE RDEEIDQYRH ALQDVLFGRT PQNVMLYGKA 
GLGKTAVTTY MMEALQDEVT KRPDADDVHV HELNCNGKSL YTVVRTLVNG LLPEHASEFP 
KRGLGTADAF EELYTQLDRI GGTHLVVFDE IDHLDDVDTL LYELPRARSI GHITNSKVGV 
IGISNNYTFR QSLSPKVKDT LMETEISFSP YDASELRTIL ADRADRAFVE GTCDDSAIAR 
AAAIAAKDRG NARQAIDLLR VGGEVATRGD DERVDDSHIV KAQELVQRGR LRNRIRDQTQ 
HAQLLLETAA YIEQQGESPA RSRTIKDRYE AVAESHAVDP LTTLKSIQNH LSDLHMLGFL 
QRRDRNHGEG GGRYYEYQLD LDPQIVVEIR QEAEAKPSP