Gene PG0120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PG0120
Symbol	epsC
ID	2551825
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Porphyromonas gingivalis W83
Kingdom	Bacteria
Replicon accession	NC_002950
Strand	+
Start bp	143144
End bp	144304
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	47%
IMG OID	637148931
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	NP_904464
Protein GI	34539985
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0000198131
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAAAAG TGATGTTGGT CTTCGGGACG AGACCCGAAG CGATCAAGAT GGCTCCGCTG 
GTGAAGGAAT TTCAAGCGAG AGCAAGTGAG TTTGATACCA TTGTCTGTGT GACGGGTCAG 
CATAGAGAGA TGCTCAAGCA AGTGCTGGAG CTATTTGATA TCAAGCCCGA TTATGACTTG 
GAGATCATGA AGGAGGGGCA GGATCTCTAT GACGTAACTA CACGTGTGCT GTTGGGTATG 
CGTGAAGTAC TCAAGAAGAC AAAGCCCGAT GTAGTACTCG TACACGGCGA TACGACTACA 
AGTACTGCCG CTGCATTGGC TGCTTTCTAT CAACAGATTC CGGTAGGACA TGTGGAGGCA 
GGGCTTCGCA CGCACAACAT TTACAGCCCA TGGCCGGAAG AGATGAACCG TCAGCTCACC 
GGTAGGATGG CTACCTATCA CTTTGCTCCT ACGGAATTGA GTCGGGACAA TTTACTTGCA 
GAAGGGATTG CTACAGATCG TATATTTATT ACAGGAAATA CAGTAATCGA TGCTCTACAA 
CAAGTCGTTA CACGAGTTAA GGGTAATGCC GATTTGCGAA ATCAAGTGTC TCGAAAGCTA 
CTTCAATTTG GATATGATGT GAATCGTTTA GAGGCTGGGC GTAGACTTGT TCTTATCACA 
GGGCATCGCA GAGAAAACTT TGGCGAAGGA TTCCTTAATA TCTGCCGTGC TATTCAAACT 
CTTAGCAAGC GTTTCCCGGA GGTAGACTTT GTTTATCCCA TGCACCTTAA CCCCAATGTG 
CGTAAGCCTA TTCGCGAGAT CTTCGGCGAT AACCTTGGAG GCTTGGATAA TCTCTTTTTT 
ATTGAGCCGC TGGAGTATTT GCAGTTTGTT ACGCTCATGG ATCGTTCGTC CATTGTTCTG 
ACTGATAGTG GAGGTATTCA GGAAGAAGCT CCAGGGTTAG GCAAACCTGT ATTGGTAATG 
CGAGATACTA CGGAGCGTCC CGAAGCGGTG AAAGCAGGAA CCGTGAAACT TGTAGGGACA 
GATTATAATC AAATCGTCGA CAATGTCGAA AAACTACTGA CAGACAACGC CGCATATGCC 
GAAATGAGCA GAGCCAATAA TCCGTACGGT GACGGAAAAG CATGCTCATA TATAGCGGAT 
GCTCTTACTC GATGCATTTA G

Protein sequence

MKKVMLVFGT RPEAIKMAPL VKEFQARASE FDTIVCVTGQ HREMLKQVLE LFDIKPDYDL 
EIMKEGQDLY DVTTRVLLGM REVLKKTKPD VVLVHGDTTT STAAALAAFY QQIPVGHVEA 
GLRTHNIYSP WPEEMNRQLT GRMATYHFAP TELSRDNLLA EGIATDRIFI TGNTVIDALQ 
QVVTRVKGNA DLRNQVSRKL LQFGYDVNRL EAGRRLVLIT GHRRENFGEG FLNICRAIQT 
LSKRFPEVDF VYPMHLNPNV RKPIREIFGD NLGGLDNLFF IEPLEYLQFV TLMDRSSIVL 
TDSGGIQEEA PGLGKPVLVM RDTTERPEAV KAGTVKLVGT DYNQIVDNVE KLLTDNAAYA 
EMSRANNPYG DGKACSYIAD ALTRCI