Gene Hlac_1613 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1613
Symbol
ID	7399562
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1632802
End bp	1633779
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	69%
IMG OID	643708679
Product	flap endonuclease-1
Protein accession	YP_002566268
Protein GI	222480031
COG category	[L] Replication, recombination and repair
COG ID	[COG0258] 5'-3' exonuclease (including N-terminal domain of PolI)
TIGRFAM ID	[TIGR03674] flap structure-specific endonuclease

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.817409
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.647176
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAAACG CGGACTTGCG CGACCTCGCA GCGATTCGCG ACATCTCCTT TGCGGAGATC 
GAGGGAAGCG TCGTCGCCGT CGACGCGCAC AACTGGCTGT ACCGGTACCT CACGACGACG 
GTGAAGTGGA CGGCTGACGA GACGTACACC ACCACCGACG GCGTCGAGGT TGCCAACCTG 
ATTGGGATCG TCCAGGGGCT CCCGAAGTTC TTCGAACATG ACCTCATTCC CGTGATGGTG 
TTCGACGGGG CGGTGACCGA GCTAAAAGCC GACGAGGTCG CCGACCGCCG CGAGAAGCGC 
GAACAGGCGG AAGAGCGCCG GGTGGCCGCC AAGGAGCGCG GCGATGCGGT CGAGGCCGCG 
CGACTGGAGG CCCGCACGCA GCGGCTCACC GACACGATTC AGGAGACGAC TCGGGAGCTG 
CTCCGGCTGC TCGACGTGCC GATCGTCGAG GCGCCGGCCG AAGGCGAGGC GCAGTGCGCG 
CACATGGCGG CGACCGGAAC CGTCGACCAC GCCGGCAGCG AGGACTACGA CACGCTGCTT 
TTCGGTGCGC CGACGACGCT CCGCCAGCTC ACGAGCAAGG GCGATCCGGA GCTGATGGAT 
CTGGCGGCGA CGCTCGACGA CCTCGGCTTC GACCGACAGG GGCTCGTCGA CGCCGCGATG 
CTCTGTGGCA CCGACTTCAA CGAGGGCGTC CGCGGGATCG GGCCGAAGAC GGCGGTAAAA 
GCGGTGCGAG AGCACGGCGA CCTGTGGGGC GTCCTCGACG CGCGGGGCGT CGAGATCCCG 
AACGCCGAGG CGATCCGCGA GCTGTTCATG GACCCGCCAG CGACGGACGT GGACGTGGAC 
ACGGCGGTGA ACCCCGACGT GGACGCCGCC CGCGAGTACG TCGTCGACGA GTGGGGCGTC 
GCCGCCGACG AGGTCGAACG CGGGTTCGAA CGCATCGCGG AGTCGCAGGT TCAGACCGGG 
CTCGACCGGT GGACGTGA

Protein sequence

MGNADLRDLA AIRDISFAEI EGSVVAVDAH NWLYRYLTTT VKWTADETYT TTDGVEVANL 
IGIVQGLPKF FEHDLIPVMV FDGAVTELKA DEVADRREKR EQAEERRVAA KERGDAVEAA 
RLEARTQRLT DTIQETTREL LRLLDVPIVE APAEGEAQCA HMAATGTVDH AGSEDYDTLL 
FGAPTTLRQL TSKGDPELMD LAATLDDLGF DRQGLVDAAM LCGTDFNEGV RGIGPKTAVK 
AVREHGDLWG VLDARGVEIP NAEAIRELFM DPPATDVDVD TAVNPDVDAA REYVVDEWGV 
AADEVERGFE RIAESQVQTG LDRWT