Gene PG2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PG2043
Symbol
ID	2552043
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Porphyromonas gingivalis W83
Kingdom	Bacteria
Replicon accession	NC_002950
Strand	+
Start bp	2142358
End bp	2143452
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	58%
IMG OID	637150620
Product	hypothetical protein
Protein accession	NP_906109
Protein GI	34541630
COG category	[S] Function unknown
COG ID	[COG0327] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00486] dinuclear metal center protein, YbgI/SA1388 family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00000126917
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATCATTC AGGATATTAT AGAGGCTATC GAGGCGGTCT GCCCGAGGGC TTATCAAGAG 
AGCTATGACA ATAGTGGCGT GCAGGTGGGC GACACCAAGC GGGAGGCAAC GGGTGCCCTC 
CTCTGTGTGG ATGTTACCGA AGCGGTATTG GAGGAGGCCA TTCGGCTGGG ATGCAATCTC 
GTCATTGCCC ACCATCCGAT TCTTTTCAAA CCGCTCAAGC GATTGACCGG CAGCTCCTAC 
GTGGAGCGAT GCGTGGAGCT GGCCGTACGG CACGGTCTGG TGCTATATGC GGCTCATACC 
AATGCGGACA ACGCTCCGCA GGGACTGAAT GCGCTGCTGG CCGAACGCTT CGGCTTGCTG 
AATACGCGAC CGCTGGAGCC GCTGCAAGGC AAGCTCTTAG AACTGGTCAC CTTCGTCCCC 
ACGGAGTATG CCGATGCCGT GAGGCAGGCT TTGTGGCAGG CCGGTGCAGG CCGTTTGGGG 
CATTACGATT GCTGTTCGTT CAGCCATGCC GGCACAGGGA CTTTCAGAGC TGCCGAGGGT 
GCCAATCCCT TTGTGGGAGC GATAAGCGAA TTGCACCATG AGGCGGAGGA GCGGATCAGC 
CTCGTACTGC CGGCATACAG GCAGGGTACT GTGCTGCAGG CTTTGCACGC GGCTCATCCG 
TACGAGCTGC CGGCTGTCAG CCTGATCCCG CTGGCCAACG ATCATCCCTC GGCCGGAGGC 
GGAATAGTGG GGGATCTGCC TTCGCCCATA AGCGAGCGGG AGATGCTGCT GCACATCAAG 
GAGGTATTCG GTCTGAAGGT CCTGTCCCAT TCGGCTTGGA GGGAACGGCC GTTGAGGCGG 
ATGGCTATAT GCGGCGGTAG CGGTGCTTTC ATGTGGCGGC GTGCAGCACA GGAGGGTGCA 
GACCTCTTCC TGACAGGGGA GGCGAAGTAC AACGACTTCT TCGATGCAGG GGAGCATCTG 
CTGCTGGTTA CGATCGGTCA TTACGAGAGC GAAGAGGTGG CTAATGAGCT ATTTATGCGC 
ATAATATCGC AGAAATTCCC TACCTTTGCC ACCCACAAAT CATCGGTTGC AACCAATCCG 
GTAAACTATT TGTAG

Protein sequence

MIIQDIIEAI EAVCPRAYQE SYDNSGVQVG DTKREATGAL LCVDVTEAVL EEAIRLGCNL 
VIAHHPILFK PLKRLTGSSY VERCVELAVR HGLVLYAAHT NADNAPQGLN ALLAERFGLL 
NTRPLEPLQG KLLELVTFVP TEYADAVRQA LWQAGAGRLG HYDCCSFSHA GTGTFRAAEG 
ANPFVGAISE LHHEAEERIS LVLPAYRQGT VLQALHAAHP YELPAVSLIP LANDHPSAGG 
GIVGDLPSPI SEREMLLHIK EVFGLKVLSH SAWRERPLRR MAICGGSGAF MWRRAAQEGA 
DLFLTGEAKY NDFFDAGEHL LLVTIGHYES EEVANELFMR IISQKFPTFA THKSSVATNP 
VNYL