Gene Hmuk_2779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2779
Symbol
ID	8412330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	2670695
End bp	2671675
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	67%
IMG OID	645021124
Product	flap endonuclease-1
Protein accession	YP_003178591
Protein GI	257388818
COG category	[L] Replication, recombination and repair
COG ID	[COG0258] 5'-3' exonuclease (including N-terminal domain of PolI)
TIGRFAM ID	[TIGR03674] flap structure-specific endonuclease

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAAACG CAGACCTACG ATCGCTGGCG TCGCTCGAAG ACGTTCCCTT CGAGGAGCTG 
AGTGACAGCG TCGTCGCCGT CGACGCCCAC AACTGGCTCT ACCGGTATCT CACGACCACG 
GTTCGGTTCA CCAGCGACGA GAAGTACACC ACCAGCGACG GGACGGAGGT GGCGAACCTG 
ATCGGCGTCG TCCAGGGGCT CCCGAAGTTC TTCGAACACG ACCTGACGCC GGTCTTCGTC 
TTCGACGGCG GCGTCACGGA ACTCAAAGAC GACGAGGTCG AGCAGCGCCG CGAGGCCCGC 
GAGGCCCGCG AGGAGAAACT CGAAGCCGCC CGCGAGCGCG GGGACTCGAA AGCTGTCGCT 
CGGCTGGACT CCCAGACCCA GCGCCTGACC GACACGATCC TCACGACGAC TCGCGAGGTG 
CTGAGGCTGC TGGACGTGCC CGTCGTCGAC GCGCCCGCAG AGGGCGAGGC CCAGGCTGCC 
CACATGGCAC GCCAGAACGT CGTCGACTAC GTCGGGACCG AAGACTACGA CGCGCTCCTG 
CTCGGCGCAC CGCTGACGCT GCGCCAACTC ACCAGCAGCG GCGACCCCGA ACTGATGGAC 
TTCCAGGCGA CGCTGGACCA CCACGGCATC ACCTGGGAGC AACTGGTCGA CGCCGCGATC 
CTGATGGGGA CGGACTTCAA TCCCGGCATC GACGGTGTCG GGCCGAAGAC CGCGATCAAG 
CTGGTGAAAG AGCACGGCGA CCTCTGGGGC GCGCTCGACG CCCGCGACGC CCACGTCGAA 
CACGGCGACC GCATCCGAGA GCTGTTCCTC GATCCGGCGG TCACGGACGA CTACGACCTC 
GATCTGGCGG TGAACCCGGA CCTTGACGCC GCCCGCGAGT ACGTCACCGG CGAGTGGGAG 
GTCGACGAAG GCGAGGTCGC GCGCGCCTTC GAGCACATCG AGGCCAGCGT CGTCCAGACC 
GGACTGGACG ACTGGGCCTG A

Protein sequence

MGNADLRSLA SLEDVPFEEL SDSVVAVDAH NWLYRYLTTT VRFTSDEKYT TSDGTEVANL 
IGVVQGLPKF FEHDLTPVFV FDGGVTELKD DEVEQRREAR EAREEKLEAA RERGDSKAVA 
RLDSQTQRLT DTILTTTREV LRLLDVPVVD APAEGEAQAA HMARQNVVDY VGTEDYDALL 
LGAPLTLRQL TSSGDPELMD FQATLDHHGI TWEQLVDAAI LMGTDFNPGI DGVGPKTAIK 
LVKEHGDLWG ALDARDAHVE HGDRIRELFL DPAVTDDYDL DLAVNPDLDA AREYVTGEWE 
VDEGEVARAF EHIEASVVQT GLDDWA