Gene Hlac_0629 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0629
Symbol
ID	7401764
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	646790
End bp	649093
Gene Length	2304 bp
Protein Length	767 aa
Translation table	11
GC content	71%
IMG OID	643707695
Product	DNA mismatch repair protein MutL
Protein accession	YP_002565301
Protein GI	222479064
COG category	[L] Replication, recombination and repair
COG ID	[COG0323] DNA mismatch repair enzyme (predicted ATPase)
TIGRFAM ID	[TIGR00585] DNA mismatch repair protein MutL [TIGR01435] glutamate--cysteine ligase/gamma-glutamylcysteine synthetase, Streptococcus agalactiae type

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCCGC CGAACATCGA GCGGTTGGAT GAGCGGACCG TCCAGCGCAT CGCGGCCGGT 
GAAGTCGTCG AGCGTCCGGC CAGCGTCGTC AAGGAGCTGA TCGAGAACAG CCTCGATGCG 
GGCGCGACGC GCGTGGCCGT CTCGGTCGAG GCGGGCGGCA CCGAGGGGAT CCGCATCCGA 
GACGACGGCG TCGGCATCCC CGCAGACCAA CTGGAGGCGG CCGTCGCGGA ACACGCTACC 
TCGAAGATCG GCAAGATTGA GGACCTCGAT CACGGCGTCG GCACCCTCGG CTTCCGCGGC 
GAGGCGCTGT ACACCGTCGG CGCGGTCTCG CGGCTCACCG TCCGGTCGCG CCCACCAGGA 
GCCGACGCGG GCTCAGAGAT TACCGTCGAG GGCGGCGACG TGGGAGACGT CCGTCCCGCC 
GGCTGTCCCG AGGGGACGAC CGTGGAGGTC GACGGCCTCT TCTACAACAC CCCCGCCCGC 
AAGAAGTTCC TCAAGCGGAC CGCCACCGAG TTCGACCGCG TGAATGCGGT CGTCACCGGC 
TACGCGCTCG CGAACCCCGG CGTCGCCGTC TCGCTGGAAC ACGACGGACG GGAGACGTTC 
GCGACGGAGG GGAACGGTGA CCTCCGGTCT GCCGTCCTCG CGGTCTATGG CCGCGAGGTC 
GCGGACGCGA TGGTGGACAT GGAGTGGGAA CCGGGTAATT CGGACACCGA CTCGCCCGTT 
CACAGTGTCA CCGGCCTCGT CTCCCACCCG GAGACGACCC GGTCGAGCCG CGAATACCTC 
GCGACCTACG TCAACGGTCG GTACGTCACG GCGGGCGCCC TCCGCGACGC CGTCCTCGAC 
GCGTACGGCG GCCAACTCGC ACCCGATCGG TATCCCTTCG CGGTGCTCTT CGTCGAGGTC 
CCGCCGGGCG ACGTCGACGT GAACGTCCAT CCGCGCAAGC TCGAAGTCCG GTTCGACGAG 
GAGCCGGCGG TACGCGCCGC GGTCGAGGAG GCGGTCGAGG CCGCGCTGCT CGACCACGGG 
CTGATCCGCT CGACCGCACC GCGAGGGCAG TCGGCCCCCG ATCAGACAGA GATCAACCCC 
GAAGGGCCGG AGACCGAGGC CATCGGCGGC GCCGGAACCG ATCACGAGCG CGCCGCGCTC 
GAAGACCGCG AGAGCGGCGA CAGGGCCGGT GAGAGCCGGG ACGGCAACGA CGATTCGGCC 
GCCGGATCCG CGGCCGACGC GTCCGAACTG GACCCCACGG ACGATGACGC GTGGGCAGTC 
GGCGACGTGA GTTCGGACGA CACCGCTGAT CCGGGCGGCC CGCCCGCCGA CCGCACCGGC 
GAGTCAGCCG GGCCCACCGC TCCCGACGGT TCCAACAGTT CCGCCGGTTC CGCGTCCGAC 
CGCCCCTCGC CGCGGAGCTG GCAGTCGGAG CCGGACGACG CCGAGGACGG TACGGAGGAG 
GGCGACACTG GCGCGGTCGC CGGCGTCGAG GCCGACACCG AGGGCGACGC CGGAGAGGCC 
GGCGGACTCG ACCGATTCGG CGGCTCGGCG ACCGACGACA ACGAGGATTC TGGCGCCACC 
GACACCTCAC CTGATCCCAC CGCCGACGCG TCGGGCGGAC GACGGGAGCC GACGGCCCAA 
CCGCGCTCGA CCGCGACCGC ACAGCGGACC CTCGATGGCG AGCCGACGAG CGCGGAGCGC 
ACCTACGATT CGCTCCCGCC GCTACGGGTA CTCGGTCAAC TCCACGAGAC GTACGTCATC 
GCGGAAGCGC CAGACGGGCT CGTGTTGATC GACCAGCACG CCGCCGACGA GCGAGTGAAC 
TACGAGCGCC TGCAGACCGC CTTCGCAGAC GGTGCCGACG CGCAGGCGCT CGCGGAACCA 
GTTCGGATCG AACTCACCGC CCGGGAGGCC GCGCTGTTCG AGGAGTTCGT CGATGACCTC 
GCGGGGGTCG GATTCCGAGC CGAGCGCGCG GACGAGCGCG AGGTGGTCGT CGAGTCGGTC 
CCGGCGGTGT TCGACGCCGC GCTCGATCCC GAACTCCTCC GAGACGTGCT CTCCGCGCTC 
GTCGGCGACG CGACCGCGGG CGACGAGCCG GTGACGGACG TGGTCGACGA ACTGCTCGCG 
GATCTCGCGT GTTACCCCTC CGTGACCGGG AACACCTCGC TGACGGAGGG GTCGGTCGTC 
GACCTGCTCG ACCGGCTCGA CGACTGCGAG AACCCCTACG CCTGCCCGCA CGGTCGGCCA 
GTCGTGATCC GGCTCAACCG CGAGGAGATC GGCTCCCGGT TCGAGCGTGA CTACCCCGGT 
CACGCGGGTC GACGCACAGA GTAG

Protein sequence

MEPPNIERLD ERTVQRIAAG EVVERPASVV KELIENSLDA GATRVAVSVE AGGTEGIRIR 
DDGVGIPADQ LEAAVAEHAT SKIGKIEDLD HGVGTLGFRG EALYTVGAVS RLTVRSRPPG 
ADAGSEITVE GGDVGDVRPA GCPEGTTVEV DGLFYNTPAR KKFLKRTATE FDRVNAVVTG 
YALANPGVAV SLEHDGRETF ATEGNGDLRS AVLAVYGREV ADAMVDMEWE PGNSDTDSPV 
HSVTGLVSHP ETTRSSREYL ATYVNGRYVT AGALRDAVLD AYGGQLAPDR YPFAVLFVEV 
PPGDVDVNVH PRKLEVRFDE EPAVRAAVEE AVEAALLDHG LIRSTAPRGQ SAPDQTEINP 
EGPETEAIGG AGTDHERAAL EDRESGDRAG ESRDGNDDSA AGSAADASEL DPTDDDAWAV 
GDVSSDDTAD PGGPPADRTG ESAGPTAPDG SNSSAGSASD RPSPRSWQSE PDDAEDGTEE 
GDTGAVAGVE ADTEGDAGEA GGLDRFGGSA TDDNEDSGAT DTSPDPTADA SGGRREPTAQ 
PRSTATAQRT LDGEPTSAER TYDSLPPLRV LGQLHETYVI AEAPDGLVLI DQHAADERVN 
YERLQTAFAD GADAQALAEP VRIELTAREA ALFEEFVDDL AGVGFRAERA DEREVVVESV 
PAVFDAALDP ELLRDVLSAL VGDATAGDEP VTDVVDELLA DLACYPSVTG NTSLTEGSVV 
DLLDRLDDCE NPYACPHGRP VVIRLNREEI GSRFERDYPG HAGRRTE