Gene Pden_1998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pden_1998
Symbol
ID	4578667
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Paracoccus denitrificans PD1222
Kingdom	Bacteria
Replicon accession	NC_008686
Strand	+
Start bp	2004932
End bp	2006002
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	72%
IMG OID	639769327
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_915786
Protein GI	119384730
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.887934
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATGG GACTGACCTT TCTGGGCATC GAAAGCAGCT GCGACGATAC CGCCGCGGCG 
GTGGTGCGCG ACGACCGCAG CATCCTTGCC TCGGTGGTGG CAGGCCAGGC GGCGCTGCAT 
GCCGATTTCG GCGGCGTGGT GCCCGAGATC GCCGCCCGCG CCCATGCCGA AAAGCTGGAC 
CTCTGCGTCG AGGAGGCGCT GGCCCAGGCC GGGCTGCGCC TGTCGGACCT GGACGGCATC 
GCCGTCACCG CGGGGCCGGG GCTGATCGGC GGCGTGCTGT CGGGCGTCAT GCTGGCCAAG 
GGGCTTGCGG CGGGCACGGG GCTGCCGCTG GTCGGCGTCA ACCATCTGGC GGGCCACGCG 
CTGACGCCGC GCCTGACCGA CGGAACCCCT TATCCCTATC TGATGCTGCT GGTCTCGGGC 
GGGCATTGCC AGTTCCTGCG CGTGGACGGC CCCGAGGATT TCACACGCCT CGGTGGCACC 
ATCGACGATG CGCCGGGCGA GGCTTTCGAC AAGGTGGCAA AGCTGCTGGG CCTGCCACAA 
CCGGGGGGGC CCTCGGTCGA GGCGGCCGCG CGGGCGGGTG ATGCACGCCG CTTCGCCCTG 
CCCCGGCCGC TGCTGGACCG GCCGGGCTGC GACCTCAGCT TTTCCGGGCT CAAGACCGCC 
GTGCTGCGCC AGCGCGACGA ATTGGTGGCA GCACAAGGCG GCCTGCACGA ACAGGACCGC 
GCCGATCTTT GCGCCGGCTT CCAGGCGGCG GTGGCCGAGG TTCTGGCCGA AAAGACCCGC 
CGTGCCCTGG CGCTGGCCCC CGCCCCGGTG CTGGCCGCGG CCGGCGGCGT CGCGGCCAAC 
CAGACCCTGC GCACGGCCTT GCAAGCAGTC GCGGCCGAGG CGGGCGCAAC CTTCCTCGCC 
CCGCCGCTGC GGCTTTGCAC CGACAATGCC GCGATGATCG CCTGGGCCGG AATCGAGGCA 
TACGAGGCGG GCCGGCGCGA CGGCATGGAT CTGGCCGCGC GCCCGCGCTG GCCGCTGGAC 
CAAAGGGCCG CACCCATGCT GGGCGCCGGA AAAAGGGGGG CCAAGGCATG A

Protein sequence

MSMGLTFLGI ESSCDDTAAA VVRDDRSILA SVVAGQAALH ADFGGVVPEI AARAHAEKLD 
LCVEEALAQA GLRLSDLDGI AVTAGPGLIG GVLSGVMLAK GLAAGTGLPL VGVNHLAGHA 
LTPRLTDGTP YPYLMLLVSG GHCQFLRVDG PEDFTRLGGT IDDAPGEAFD KVAKLLGLPQ 
PGGPSVEAAA RAGDARRFAL PRPLLDRPGC DLSFSGLKTA VLRQRDELVA AQGGLHEQDR 
ADLCAGFQAA VAEVLAEKTR RALALAPAPV LAAAGGVAAN QTLRTALQAV AAEAGATFLA 
PPLRLCTDNA AMIAWAGIEA YEAGRRDGMD LAARPRWPLD QRAAPMLGAG KRGAKA