Gene Huta_1887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_1887
Symbol
ID	8384178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	+
Start bp	1894137
End bp	1895147
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	69%
IMG OID	644972955
Product	orc1/cdc6 family replication initiation protein
Protein accession	YP_003130789
Protein GI	257052956
COG category	[L] Replication, recombination and repair [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1474] Cdc6-related protein, AAA superfamily ATPase
TIGRFAM ID	[TIGR02928] orc1/cdc6 family replication initiation protein

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGAGG ACGCCCGCGT GCTCCGCGAG GAGTTCGTCC CGAACGACGT CGTCCACCGC 
GACGGCGAGG TCGACGCGCT CTCGGCCGTC CTCGAACCCG TCGTCGAGGG CGAACCGCCC 
GAGTCCGCGC TGCTCACCGG CCCCTCGGGA GCCGGCAAGA CCACCATCGC GAAGTTCGTC 
GTCGGCCGCC TCCGGGAGAC CGCCCTCGAC GTCGAGGCGA TCCACGTCAA CTGCTGGCAA 
TCGTACACTC GCTTCAAAGC CCTCTACCGG ATTCTCGAGG GCCTCGGCCG GACGATCGAC 
GTCCACCGCC AGTCGACGCC CCACGACGAA CTCCTCGATC GGCTCGAAGC CTACGACGGC 
CCGCCCGTCA TCGTCACGCT CGACGAGGTC GACCAGCTCG AGGACGGCCA CCTGATCTAC 
GACCTCTACC GCCTCCCCGC GTTCGCGGTC GTCCTGATCA CCAACGACGA GGAAGAGCTG 
CTGGCCGGCC TCGACGAGCG CGTCCGGTCG CGGCTTCACA CCGCCGAGAC GATCCATTTC 
GACCGCTACG ACGTCGAAGA GCTGACCGAC ATCATGGCCG ACCGCGTCGA CCACGGGCTG 
GCTTCGGGGG CCGTCGACTT CGACCAGCTC CGGTGGATCG CCGACGCCGC CGCCGGCGAC 
GCCCGCGTCG GGTTGAGTAT CCTCCGGAGC GCCGCACGGC GGGCCGACCG CGACGGTGCC 
GATGCTATCG CCGCGTCCCA CATCGAGGCC GCGATCCCCG AAGCCCGCCG GGAAGTCCGG 
TCGCGGGCCC TCGACGCACT GCACAAGGAG CAACGGAAAG TATTCGAGAT CCTCCGGGAG 
AGCGACGGGC TCCCGCCGCG GGAGGTCTAC GATCGGTACG TCGCGGCGGT CGAGGATCCC 
CGGACGAAGC GGACGGTCCG GTCGTGGCTC CAGAAAATCG AACAGTACAA CCTGGTCGAG 
GCCGACGGGA GTGGCCCGAC CCGGACGTAT CGCGTCATCG CCGAGGAGTA G

Protein sequence

MIEDARVLRE EFVPNDVVHR DGEVDALSAV LEPVVEGEPP ESALLTGPSG AGKTTIAKFV 
VGRLRETALD VEAIHVNCWQ SYTRFKALYR ILEGLGRTID VHRQSTPHDE LLDRLEAYDG 
PPVIVTLDEV DQLEDGHLIY DLYRLPAFAV VLITNDEEEL LAGLDERVRS RLHTAETIHF 
DRYDVEELTD IMADRVDHGL ASGAVDFDQL RWIADAAAGD ARVGLSILRS AARRADRDGA 
DAIAASHIEA AIPEARREVR SRALDALHKE QRKVFEILRE SDGLPPREVY DRYVAAVEDP 
RTKRTVRSWL QKIEQYNLVE ADGSGPTRTY RVIAEE