Gene PG1542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PG1542
Symbol	prtC
ID	2553029
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Porphyromonas gingivalis W83
Kingdom	Bacteria
Replicon accession	NC_002950
Strand	+
Start bp	1620928
End bp	1622172
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	50%
IMG OID	637150179
Product	collagenase
Protein accession	NP_905681
Protein GI	34541202
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGTAA ACGACTTCGA GATAATGGCT CCAGTCGGTT CGTACGAATC GCTTATGGCA 
GCCATCAAGG CAGGAGCAGA TTCAGTTTAC TTCGGGATTG AAGGACTGAA TATGCGTGCG 
CGATCTGCCA ACAACTTCAC CACAGAAGAT CTGTACAAAA TAGCCGAGAT TTGCAGAGAT 
AAAGGCGTAA AGAGCTATTT AACGGTGAAT ACCGTCATAT ACGATGAGGA CATAGCACTC 
ATGCGCTCCG TCATCGATGC GGCACAAAAG GCACAAATAT CTGCCATTAT AGCTTCCGAC 
GTAGCTGCGA TGATGTATGC CAACGAGATC GGAGTAGAAG TGCATCTGTC CACTCAGCTC 
AATATCAGCA ACGCGGAGGC CCTACGCTTT TATTCGCGCT TTGCCGATGT GGTCGTATTG 
GCAAGAGAGC TGAATATGGA TCAGGTGCGT ACAATCCACG AGACCATCGT CAGGGATAAT 
ATCTGTGGGC CTAAAGGCCA TCCCGTACGT ATAGAGATGT TTGCTCACGG CGCTCTGTGT 
ATGGCCGTTT CGGGCAAGTG CTATCTAAGC CTGCACGAAC ACAACAGCTC CGCCAACAGA 
GGAGCCTGTG CGCAGATCTG CAGGAGGGGC TACACCGTCA AGGACAAGGA TAGCGGTCTG 
GAACTGGACA TTGAGAACCA ATACATCATG TCGCCGAAAG ATCTGAAGAC TATTCATTTC 
ATCAATAAGA TGATGGATGC CGGCGTACGA GTATTCAAGA TAGAAGGAAG GGCACGTGGC 
CCCGAATACG TCTATACGGT CTGCCGCTGC TATAAAGAAG CGATCGAAGC CTACTGCAAC 
GGCACCTATG ATGAAGAGGC CATAGGCCGG TGGGACGAAC AATTGGCTAC GGTATTCAAC 
CGAGGCTTTT GGGATGGCTA CTACCTCGGA CAACGGCTCG GCGAATGGAC ACATCGTTAC 
GGCTCAGGAG CTACGCGACA GAAAATATAT GTAGGCAAGG GGATCAAATA CTTCAGCCGT 
CTCGGTGTGG CTGAATTCGA GATAGAGTCC GGCGAACTGC ATATAGGCGA TGAGATTGTG 
ATCACCGGCC CTACTACAGG TGTGATCATC CAAAAGGTGG AAGAGATCCG ATACGAACTG 
CAAACCGTGG AAAAGGCGAC AAAGGGACAA CGCATTTCCA TTCCGGTAAA GGAGAAAGTG 
CGTCCGTCGG ACAAGCTCTA CCGGTTCGAC AAAAGAGAAG AATAA

Protein sequence

MNVNDFEIMA PVGSYESLMA AIKAGADSVY FGIEGLNMRA RSANNFTTED LYKIAEICRD 
KGVKSYLTVN TVIYDEDIAL MRSVIDAAQK AQISAIIASD VAAMMYANEI GVEVHLSTQL 
NISNAEALRF YSRFADVVVL ARELNMDQVR TIHETIVRDN ICGPKGHPVR IEMFAHGALC 
MAVSGKCYLS LHEHNSSANR GACAQICRRG YTVKDKDSGL ELDIENQYIM SPKDLKTIHF 
INKMMDAGVR VFKIEGRARG PEYVYTVCRC YKEAIEAYCN GTYDEEAIGR WDEQLATVFN 
RGFWDGYYLG QRLGEWTHRY GSGATRQKIY VGKGIKYFSR LGVAEFEIES GELHIGDEIV 
ITGPTTGVII QKVEEIRYEL QTVEKATKGQ RISIPVKEKV RPSDKLYRFD KREE