Gene Huta_2512 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_2512
Symbol
ID	8384814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	+
Start bp	2582527
End bp	2583507
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	64%
IMG OID	644973586
Product	flap endonuclease-1
Protein accession	YP_003131409
Protein GI	257053576
COG category	[L] Replication, recombination and repair
COG ID	[COG0258] 5'-3' exonuclease (including N-terminal domain of PolI)
TIGRFAM ID	[TIGR03674] flap structure-specific endonuclease

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAACG CCGATCTCCG GGATATCGCC GTCATCGAGG ACGTCAGCTT TGACGTGTTG 
GAGGGCTCGG TCGTCGCCGT CGACGCCCAC AACTGGCTGT ATCGGTATCT CACGACCACG 
GTCAAGTGGA CGAACGACGA CATCTATACG ACTGCGGACG GAACGGAAGT CGCCAATCTT 
GTCGGCGTCG TCCAGGGCCT GCCGAAGTTT TTCGAGGCCG ACGTCACGCC CGTGTTCGTC 
TTCGACGGCG CAGTCACGGA CCTCAAGGAC GACGAGGTAC AGCGTCGGCG CGAGCAGCGC 
GAACAGTACG AGGACCAACT CGAAGACGCT CGCGAAGCGG GTGACGCGGT CCGGGTAGCC 
CGTCTCGAAT CCCGGACCCA GCGACTCACC GACGTCATTC TGGAGACGAC TCGTGAACTC 
CTCGCGCTGC TCGACGTGCC GACCGTCGAC GCCCCAGCCG AGGGGGAAGC GCAAGCCGCC 
CACATGGCCC GGCGGGGCGA TGTTGACTAC GTTGGCACCG AAGACTACGA CGCCCTCCTC 
TTTGGCGCAC CCTTCACGCT CCGGCAACTC ACCAGTTCTG GTGACCCCGA GCTGATGGAC 
TTCGAGGCGA CGCTTGCGGA ACACGACCTC TCCTGGGAGC AACTCGTCGA CGTCGCCCTG 
CTCTGTGGGA CGGACTTCAA CGATGGTGTC CGGGGTTACG GCCCCAAGAC AGCGGTCAAA 
GCCGTTCGCG AGCACGGCGA TCTCTGGGGC GTCAGCGAGA ACGAGGACGT CTACGTCGAG 
AACGCCGATC GGATCCGCGA GCTGTTTCTC GATCCCGCCG TCACCGAGGA GTATACCATC 
GAGACGAGTA TCGACCCTGA TCTGGCAGCC GCCCGCGAGT TCGTCACCGA CCAGTGGGCG 
GTCGACGCCG AGGAAGTCGC TCGCGGGTTC GAACGGATCG AATCGTCGGT CGTCCAGACG 
GGCCTGGAAG ACTGGACCTG A

Protein sequence

MGNADLRDIA VIEDVSFDVL EGSVVAVDAH NWLYRYLTTT VKWTNDDIYT TADGTEVANL 
VGVVQGLPKF FEADVTPVFV FDGAVTDLKD DEVQRRREQR EQYEDQLEDA REAGDAVRVA 
RLESRTQRLT DVILETTREL LALLDVPTVD APAEGEAQAA HMARRGDVDY VGTEDYDALL 
FGAPFTLRQL TSSGDPELMD FEATLAEHDL SWEQLVDVAL LCGTDFNDGV RGYGPKTAVK 
AVREHGDLWG VSENEDVYVE NADRIRELFL DPAVTEEYTI ETSIDPDLAA AREFVTDQWA 
VDAEEVARGF ERIESSVVQT GLEDWT