Gene PG0414 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PG0414
Symbol
ID	2551602
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Porphyromonas gingivalis W83
Kingdom	Bacteria
Replicon accession	NC_002950
Strand	-
Start bp	451862
End bp	453742
Gene Length	1881 bp
Protein Length	626 aa
Translation table	11
GC content	51%
IMG OID	637149186
Product	hypothetical protein
Protein accession	NP_904716
Protein GI	34540237
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.867976
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAAGG GAGAAAAACG AGAATCTCGG CTCGGTAGCC GACAACTGGG GGCGATAATT 
CTGATCGTCA CTCTCTCTTT TTCTGCCCTT GCCTCTCTCC AAGGTCCCCC TCCCAAAGGG 
AGTAAGGGGA AAACGCATGT CATCCTCGAA CATGCCGATG AACTCCGTTA CGACAGACTC 
TACAACCCCG ATGTACAGCG TCTGCTTGGC AATGTCGTGA TCAAGCATGA AGGAGCTGTG 
ATGCGCTGCG ACAGCGCTCA TCTTAATCAG GAAGAGAACA CTTTCGAAGC ATTCGGCCAA 
GTTTCCATGC AGCAGGGCGA CACCGTATCC ATGTTCGCCC GCTATCTCCA TTATGATGGA 
AACATCAAAT ACGCTCGTCT TCGCCATGAA GTGCGACTGG AAAATCGTTC GGCTACTCTC 
TTTACGGATA GTTTGGATTA TGACCGGGTC ATGAACCTGG GCTACTATTT CGAAGGTGGT 
AGCATAGTCG ACTCTCTCAA TACGCTGACT TCCAGCTATG GAGAATATTC TCCCACCACA 
TCCGATGCCA TCTTCCGAGA TAATGTCCAT TTGGAAAATA AGGACTATAC CATGGACACG 
GAAGAACTTC ATTATAATAC AGATACCAAG ATCAGTCACA TATTGGGGCC TACGGAGATG 
AGATCGGACT CCGGCTATAT CGTTTCTACG CGAGGAGTGT ACGATTCGAA CACCGATGTA 
GGCATTTTGC TGGATCGCTC CATCGTTTAT TCCTCCAACG GGGCCAAGCA ATTGACGGGG 
GACTCGATCT TTTACGACCG TCGTACCGGT TTTGGCGAAG CCTTCGGCAA TATGATCCTC 
ACCGATACGG TGAACCGTTC TTCTCTTTAT GGGGAGTATG GTTATTACGA TGAGAAGAAG 
GACTATGCTT TTGCCACCCA ACGATCTTAT ATGATCGACT TTTCCAAACC CGACACCTTG 
TGGGCAGCAG CCGACACGCT TGAGATGATC ACGCAGCGTC GCGTCCCCGA GGATAGGCGG 
ATAGCACGCG GGTACAGACA TGTACGGGTT TATCGAACTG ATGTCCAAGC CATTGCCGAC 
TCTATGCAGT ACGACTCTCG CGATTCTCTG CTCTACCTTT ATGACAACCC CATTATGTGG 
AATGAAGACT CCCAGTTGAG CGGCGATACG ATCCGGTTCA AATTCCGCAA CGACAGTCTG 
GACTATGTCG ATGTGCTTAC CAAGGCTCTT GCCGTTCGGC GGATAGATTC CGTCATGTAT 
GACCAGCTGG CCGGCAGACA TATCAGAGCC TATATGCAGG ACAGCCTTGT ACGCCAGATA 
CAGGTGCATG GCAATGCCGA AGTCATCCAA TACGAACAGC ACAAACGATC GAAACGCTGG 
TATCTGATGA ATCGAATCGA AGCTCCCTCT ATAATTGCCG ATTTCGAAGA AGGCCAACTC 
AAGAAAGTAC TCTTGCGTGG AGTGGCATCG GGCAAAGGCT ACCCGATCAA AATGCTCACG 
CCCGATCTTC AACGCTTGGC CTCTTTTCGA TGGGAGGAGG CTGTCAGGCC GAAATCGAAG 
GAGGATCTTT TCCGCAGGCA GCCGGATTCC GTCTTGCAGG TGCATCGATC GCTGTCCGAT 
TTGCGACGCT TTAGCGGTGC TTTGGCAGCC CTTCGTGCAT ACACGGCTCT GGCCGAAGAG 
GAGAGAAAAG ACTCATTGAC AATCGCTGCC CTACAGACCG ACTCCATTCC TCCGACACCT 
GCAGCCGGCA AAGAGGCTAC CGATCCTACA GACCGGCTCT CTCCTTATAT TGCCCGACCT 
ACTACGGACA CCAAAGAGGA AGGCTTCTTC GATCTTTTCT TCACTCCATT CATCTTTAAT 
AGAGAAAAAC TATGGGATTA G

Protein sequence

MRKGEKRESR LGSRQLGAII LIVTLSFSAL ASLQGPPPKG SKGKTHVILE HADELRYDRL 
YNPDVQRLLG NVVIKHEGAV MRCDSAHLNQ EENTFEAFGQ VSMQQGDTVS MFARYLHYDG 
NIKYARLRHE VRLENRSATL FTDSLDYDRV MNLGYYFEGG SIVDSLNTLT SSYGEYSPTT 
SDAIFRDNVH LENKDYTMDT EELHYNTDTK ISHILGPTEM RSDSGYIVST RGVYDSNTDV 
GILLDRSIVY SSNGAKQLTG DSIFYDRRTG FGEAFGNMIL TDTVNRSSLY GEYGYYDEKK 
DYAFATQRSY MIDFSKPDTL WAAADTLEMI TQRRVPEDRR IARGYRHVRV YRTDVQAIAD 
SMQYDSRDSL LYLYDNPIMW NEDSQLSGDT IRFKFRNDSL DYVDVLTKAL AVRRIDSVMY 
DQLAGRHIRA YMQDSLVRQI QVHGNAEVIQ YEQHKRSKRW YLMNRIEAPS IIADFEEGQL 
KKVLLRGVAS GKGYPIKMLT PDLQRLASFR WEEAVRPKSK EDLFRRQPDS VLQVHRSLSD 
LRRFSGALAA LRAYTALAEE ERKDSLTIAA LQTDSIPPTP AAGKEATDPT DRLSPYIARP 
TTDTKEEGFF DLFFTPFIFN REKLWD