Gene PG1072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PG1072
Symbol
ID	2553210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Porphyromonas gingivalis W83
Kingdom	Bacteria
Replicon accession	NC_002950
Strand	+
Start bp	1139116
End bp	1140507
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	44%
IMG OID	637149773
Product	MutS family protein
Protein accession	NP_905287
Protein GI	34540808
COG category	[L] Replication, recombination and repair
COG ID	[COG0249] Mismatch repair ATPase (MutS family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.6736
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTAC GGGAACAGAT AAATAGCATT AGTGGCTTTC GCTATGTAAT AGATGAGTTG 
TGCATACATT CATCTGTAGG GCGACGTTGT CTGATGGAGC AAGAATTCTT GACCGAGGCT 
TCCGATATTG AAGTGCTTCT TTCTCGTGTA GAAATAGCCA TCTCATACCA AGCAGACCAA 
CGAAAACAAA AAGGTCTGGA TGAAATTGCA CACAAATTAA TGCAGCTGCG TGACATCCAA 
GGGACGATAT ATTCTCTTTC ACGCCACGTA GTTTGCACGG ACATTGATTT TTTCGAGATC 
AAGTTCTTAG CAATTTTAAG TGAAGATATT CGGGATCTGA TCCGTTTTTA CCAGTTAGAT 
GATCTCTCTT CTCCCCTACC CGATTTGTCG CATATCGTTT CCGTTTTGGA TCCGGAGGAA 
AAGAAAATTC CTCATTTCTA TATATACGAT GCATATTCGG AGACATTGAG AGAGTTGAGA 
GACAGGCTCA AAAAAGAAAC AAACGAAGAC GCCAGGATCG AAATCCGCAA TGAAAGTTTG 
CAGGAGGAAG ACATAGTCCG TAAGCGACTT TCTCGCGAGT TGTCCCCTTA TGCTGGAGGA 
TTGGCTACAG CTCTGGAATT GTTGGGAGCG ATAGATCTGT TATTAGCAAA GGTCAAACTA 
TTCATTCAGC TTGGATGGAG TAAACCGGGT TCTGGTCATA GTGTTACGAA CTATATGGGA 
CTGGTACATC CACATGTCCT TAGCCTCCTG GGGAAAAAAG GAGAAAAGTT CCAGCCGGTA 
GATATAGCCC TACCCTCTCT GCCAACCTTA ATTACCGGTG CTAACATGGC AGGAAAAAGT 
GTGCTGTTGC AAGGAGTTGC ATTAGCTCAG ATCCTCTATC AATATGGCTT CTATGTGCCG 
GCACAAAAGG CAGAGATATG CCCTGTAGAA AAAGTGATGC TTTCACTTGG AGATGCACAA 
GATATTAGAC AAGGGCTTTC CTCTTTCGGG GCGGAAATGA TGTGTCTTTC GTCCATTGCC 
GATGAGGCCA GACAGGGAAA GCAACTACTC GTTTTAGTCG ATGAACCTGC AAGGACAACG 
AATCCTGTAG AAGGACAAGC CATTGTCAGT GGACTATTGG CTATATTGAG CAGGTATAAG 
ATCCGATCTC TCGTCACTAC GCATTATGGC AGTATAGACA TTCCATGTCG CCGCTTGAAA 
GTGCGTGGTT TTAGAGAAGA CAAAGTGAAC TTACCTCTAC AAGTAAATTC CCTCAGCAAA 
TGTGTGGACT ATACGCTTGA AGAAGTGAGC GAAAACGATG TTCCACACGA AGCAATACGC 
ATAGCAGAGA TCCTTGGGGT TAACGAGGCT CTTATGACAG AATGCAAACA GTTTTTGAAC 
AACACGAAAT AG

Protein sequence

MKLREQINSI SGFRYVIDEL CIHSSVGRRC LMEQEFLTEA SDIEVLLSRV EIAISYQADQ 
RKQKGLDEIA HKLMQLRDIQ GTIYSLSRHV VCTDIDFFEI KFLAILSEDI RDLIRFYQLD 
DLSSPLPDLS HIVSVLDPEE KKIPHFYIYD AYSETLRELR DRLKKETNED ARIEIRNESL 
QEEDIVRKRL SRELSPYAGG LATALELLGA IDLLLAKVKL FIQLGWSKPG SGHSVTNYMG 
LVHPHVLSLL GKKGEKFQPV DIALPSLPTL ITGANMAGKS VLLQGVALAQ ILYQYGFYVP 
AQKAEICPVE KVMLSLGDAQ DIRQGLSSFG AEMMCLSSIA DEARQGKQLL VLVDEPARTT 
NPVEGQAIVS GLLAILSRYK IRSLVTTHYG SIDIPCRRLK VRGFREDKVN LPLQVNSLSK 
CVDYTLEEVS ENDVPHEAIR IAEILGVNEA LMTECKQFLN NTK