Gene Tpet_1786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpet_1786
Symbol
ID	5170129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermotoga petrophila RKU-1
Kingdom	Bacteria
Replicon accession	NC_009486
Strand	+
Start bp	1796435
End bp	1797940
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	42%
IMG OID	640564307
Product	DNA mismatch repair protein MutS domain-containing protein
Protein accession	YP_001245362
Protein GI	148270902
COG category	[L] Replication, recombination and repair
COG ID	[COG0249] Mismatch repair ATPase (MutS family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00151585
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGTAC TTTTGATGTA CCCAGACAAG GATTTCAATT TGAAAAGAGA GTTGCCTTTC 
AATGCAGATG ATTTGACAAG AGATCTCGGT TTAGATGTGA TATTCGATCA CATGGCAAAG 
GGAGATGGTT ACCTGTATAG TGTTGTGAGA AATGTCATTC TGAATCCAGA AACCGATCTG 
GAGACGATAA AGTACCGCCA GGAAATTCTC AAAGATTGTA TGAAAAACCA GAACGTCGTA 
AGGCGGTTGT TTCAGATACC GCTGGAGGTT CAAGAAAACA AGAAGAAAAA TTGGTGGGGG 
GTTTTTGGAT GGAAAACTCC TATCAATGTC CTGAACGGCT CCAGAAAAGC TTTAGAAGCC 
ATGCTGGTAG CGCTCAGAGA GCTTAAAAAG TTGGCAGATG AACATCGTCA CAATTTTCAT 
TCTCGAGGCT TCACAAGGTT TTTCGAGATG ATAAGGACGG AACTGGATGA AGCCTACTTA 
CAAACTGTGG AGAAGCATCT CATTAATTTG AGATTTTCAA ACGGTATGTT GTTCAAAGTA 
AAACTCGGAA AAGGTAACGA AGGAAAAGAT TACACCCTCT GCCAGCCTGA CTCTTCAAGA 
AGCATCCTGA AAAGACTACT CAGTGTGAGA CGAATGTATT CTTATAAATT ACATCCAAGA 
GATGAAAGTG GAGCACGAGC ACTGGAGAAG TTGACCAATT TGGGACTTCG CAGGGTAGCA 
GCCACAGTTT ACTACGCGGC AGAGCATGTA GAAAAATTTT TGAACAAAAT TCGAGAAGAA 
CTGGCTTTCT ATATTGGTTG TCTCAACTTG CTGGAAGATG TAGAAAAATC GAAGATAAGT 
TTTCCCGATC CCAAACCAAT TGATGAGGAC GATGTAACCG CCTTCAGAGG GCTTTACGAT 
CTTAGTTTGC TTCTAATAAA GAGAAATAGA GTGATAAGTA ACGATCTGAA CACGCGTGGT 
AAAAGAGTTT TTTTCATCAT GGGAGCGAAT CGCGGTGGGA AGACCACTTT CCTGAGAAGT 
ATAGGGCAAG CTCAGCTGAT GATGCAAGCT GGTATGTTCG TTCCGGCGTC GTACTTTGAA 
TCGAACGTTT GCAAAGGAAT TTTTACGCAC TTTAAAAGAG AGGAAGATCC AAGCTTGAAG 
AGAGGAAAAT TTGAAGAAGA ACTTGTCAGA ATGAATGAGA TAGTCCTTCA TCTGCATAGA 
AGGTCTATGG TGCTATTCAA CGAGTCCTTC TCATCTACGA ATGAAATGGA GGGTTCCGAA 
GTGGCCTACC AGATTGTTCG AGCTCTACTG GACAGCCGTG TTAAAGTTTT TTACGTAACA 
CACGTGTACG AACTGGCCCG CCGTTTTACA GGAGATGAAA GAGTGATGTT TCTACAAGCA 
GAAAGGAAAC CTACCGGTGA AAGAACCTTC AAGATCAAAG AAGGCCTGCC TTCGCAGACA 
AGTCATGCGA AGGATATATA CCTCAAAGTG TTCAGATCAT CAACTTCAAC TTCACCATCC 
TCTTGA

Protein sequence

MRVLLMYPDK DFNLKRELPF NADDLTRDLG LDVIFDHMAK GDGYLYSVVR NVILNPETDL 
ETIKYRQEIL KDCMKNQNVV RRLFQIPLEV QENKKKNWWG VFGWKTPINV LNGSRKALEA 
MLVALRELKK LADEHRHNFH SRGFTRFFEM IRTELDEAYL QTVEKHLINL RFSNGMLFKV 
KLGKGNEGKD YTLCQPDSSR SILKRLLSVR RMYSYKLHPR DESGARALEK LTNLGLRRVA 
ATVYYAAEHV EKFLNKIREE LAFYIGCLNL LEDVEKSKIS FPDPKPIDED DVTAFRGLYD 
LSLLLIKRNR VISNDLNTRG KRVFFIMGAN RGGKTTFLRS IGQAQLMMQA GMFVPASYFE 
SNVCKGIFTH FKREEDPSLK RGKFEEELVR MNEIVLHLHR RSMVLFNESF SSTNEMEGSE 
VAYQIVRALL DSRVKVFYVT HVYELARRFT GDERVMFLQA ERKPTGERTF KIKEGLPSQT 
SHAKDIYLKV FRSSTSTSPS S