Gene Athe_1499 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1499
Symbol
ID	7408158
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1581418
End bp	1583187
Gene Length	1770 bp
Protein Length	589 aa
Translation table	11
GC content	35%
IMG OID	643715862
Product	DNA mismatch repair protein MutL
Protein accession	YP_002573370
Protein GI	222529488
COG category	[L] Replication, recombination and repair
COG ID	[COG0323] DNA mismatch repair enzyme (predicted ATPase)
TIGRFAM ID	[TIGR00585] DNA mismatch repair protein MutL

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGAGC TTTACAAACT TCCTGAACAG TTAACTCACA TCTTGGCAGC GGGTGAGGTT 
GTAGAAAGAC CGGCATCCTG CCTTAAAGAA CTTTTGGAAA ATTCAATAGA TGCAGGAGCA 
AATTTAATTG ATGTTAAAAT AGAAAAAGGT GGTATGAAGA GAATTGAGGT ATATGATAAT 
GGGAAGGGAA TTCACCCTGA TGACATTGAA TATGTGTTTG AAAGACATAC AACCAGCAAG 
ATAAAATCTT TTGAGGATAT ATTTAGCATC AAAACAATGG GATTTAGAGG GGAAGCGCTC 
TGTGCAATAT CAAGCGTATC AAAGGTGACA CTTGTTTCTA AGCATTTAGA AGAAGAACAA 
GGGTGCATGG TAAAAGTAGA AGGTGGGAAA GTCCTTTCTA AAAGTTTTTG TCCTTTTAAA 
GAGGGGACAA GAATTGTTGT TGAAGATATT TTTTACAATA CTCCTGCAAG GTTAAAATTT 
TTAAAATCTC CAACAACTGA ACAAAAGTAT TGTCTTGAGG TGGTAGAAAA GATTGCAATT 
GCATGGCCGG AGATTTCATT TCGGGCAGAG GCAGATGGCA AAAGACAAAT TTTTACACCA 
GGAGATAATA AGATTGAATC TGCCATTGGT TCTATATTTG GGATAGAAAT AGTAAAAAAT 
CTTGTTGAAT TTTCTCTTGA GAAAGAATCT TTAAAAGTTT GGGGTTATTT TGTAAACCCC 
ACTGTGAGCA GAGCTACACG CTCAGGTTAT CATTTTTATG TCAACCGAAG ATATATCAAA 
AGCAAACTTC TTTCATCGTG CATTGATGAG GCATTTAAGA ATTCGGTCAT CACAGGTAGA 
TTTCCAATAG TTTTTCTTTT TATACAAATT CCGCCTTCTG AGATTGATGT CAATGTGCAT 
CCATCAAAAC TCGAAATAAA GTTCAGAGAT GAAAGATTTG TTTACAATAC CATTTATAAA 
GCTATAACAG ATTCGTTGAA ATCGGAAAAA ATGATTCCTA AAGCTGATTT AAGTAAAGCT 
AATGTTGGAA ATGATGCTGT TGCTGAGCGA AAACAAACTG GAGTTTTATC TGATAACTTA 
AAAAATGATA TATCTTTAGT TATCTCAGAG CAGCCAAATT TCTTTGGAAT GTTTTCAAGG 
AGTGAAGAGA TTGTAATTGA GCAACAGGGC TTTGAAAACT TTGATGCAGG AAACTACAAG 
ATTGTTGGTT ACGCTTTTGA TACCTATATA ATTGTGCAAG GCGATGACAG CTTATACCTT 
ATTGACCAGC ACGCGGTGCA CGAAAGAAGA TTATTTGAAG ATTTTAAAAG CCAAATTTAT 
TCTTCAAATG TTCAAAGCCA AGTGTTGGTT TCTCCTGTTA TTGTTCAGAT TCCATCTTCA 
CGAAAAGAGT TTGTGATTTC AAACCGAGCT ATCTTTCAAA AGATGGGTTT TGAAATTGAG 
GATTTTGGGA AAAATGAAAT ATTAGTGAGG ACATGGCCTG CTATACTGAC TGAGAACATC 
GAAAAAATGT TTTTAATTGA CATAATAGAG ATGATATACG AACAAATGGT TGAAGATAAG 
AGTCTTGTAG GAATTTCTGA GGACCTGCTA AAAAGAATTG CTTGCAGAGC AGCAGTAAAA 
GGAAATAGTA AAATTTCAGA CTTAGAAAAA AAAGAAATAG TTGAACTTGT GCTAATCAAA 
AAAGAAATTT TTCACTGTCC GCATGGAAGA CCAGTGGTAG TAGAGATTTC TAAGAGAGAA 
ATTGAAAAAA TGTTCAAAAG AATTGTATAA

Protein sequence

MRELYKLPEQ LTHILAAGEV VERPASCLKE LLENSIDAGA NLIDVKIEKG GMKRIEVYDN 
GKGIHPDDIE YVFERHTTSK IKSFEDIFSI KTMGFRGEAL CAISSVSKVT LVSKHLEEEQ 
GCMVKVEGGK VLSKSFCPFK EGTRIVVEDI FYNTPARLKF LKSPTTEQKY CLEVVEKIAI 
AWPEISFRAE ADGKRQIFTP GDNKIESAIG SIFGIEIVKN LVEFSLEKES LKVWGYFVNP 
TVSRATRSGY HFYVNRRYIK SKLLSSCIDE AFKNSVITGR FPIVFLFIQI PPSEIDVNVH 
PSKLEIKFRD ERFVYNTIYK AITDSLKSEK MIPKADLSKA NVGNDAVAER KQTGVLSDNL 
KNDISLVISE QPNFFGMFSR SEEIVIEQQG FENFDAGNYK IVGYAFDTYI IVQGDDSLYL 
IDQHAVHERR LFEDFKSQIY SSNVQSQVLV SPVIVQIPSS RKEFVISNRA IFQKMGFEIE 
DFGKNEILVR TWPAILTENI EKMFLIDIIE MIYEQMVEDK SLVGISEDLL KRIACRAAVK 
GNSKISDLEK KEIVELVLIK KEIFHCPHGR PVVVEISKRE IEKMFKRIV