Gene Pden_4635 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pden_4635
Symbol
ID	4583140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Paracoccus denitrificans PD1222
Kingdom	Bacteria
Replicon accession	NC_008688
Strand	+
Start bp	122749
End bp	123795
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	66%
IMG OID	639771941
Product	peptidase M42 family protein
Protein accession	YP_918394
Protein GI	119387360
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0148815
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCGCG ACAGCGAATT GTTCGACCTG ATCGGCGACC TGATCATGTG CCATTCGCCC 
AGCGGGGTCG AGGCGCGGAT CGACGCCTTC CTTCTGCAGC GGCTCTCGGA ACTGGGTATC 
GAGGCGGCGC TGGACGCCGC CGGGAACGTC GTCGCACGCA TTCCCGGCAG CGGGGCGGGC 
AAGCTGGCGA TCACCGCCCA CAAGGATGAG ATCGGCGCAT CGGTCAGCAC CGTCGGGGAC 
GATGGCCGGC TCAGGCTGCG CGCCTTGGGA TCGTCCTTCC CCTGGGTCTA TGGCGAGGGA 
ATCGTGGATA TCCTGGGCGA CAACGAGACG ATTCAGGGCG TCCTCAGCTT CGGATCGCGC 
CACATCACCC GCGCCTCGCC GCAATATCCG CAGCAAGAGA CCGCGCCGGT CAAATGGTCG 
GATGTCTGGG TCGAGACCAA GTGCAGCTGC GACGACATCG CCAAGGCGGG CGTGCGGCCG 
GGCTCTCGCG TGCTGGTCGC GAGGCATCGC AAGGCGCCCT ATCGGTTGGG CGACCATATC 
GCCGGCTATA CGCTGGACAA CAAGGCCTCG GTCGCGGTCC TGATCGAGCT GGCCAAGCGG 
ATCCGCAACC CGGTCTCGGA GATCTGCCTG GTCTTTTCGT CCATGGAAGA GGTCGGTGCC 
TGCGGCGCGC TGTATTTCAC CAGAAACGAG CCCGTGGATG CGATCATCGC GCTGGAGATC 
GCCCCCCTGT CCGATGAATA CGACATCGTG GATGGCCCGG ACCCGGTGAT CTATGCGCAG 
GATGGCTATG GCCTTTACCA TGAGGGGCTG AACGGCCGGA TCGCCGCCGC GGCCGCGCGG 
GCGGGGGTCG GACTGCAACG CTCGGTGGTC CATGATTTCG GCAGCGACGC CTCGATCGTG 
ATGCGCAACG GGCATGCGCC GCGCGGGGCC TGCCTGGCCT TCCCGACGCA GAACACCCAC 
GGATACGAGA TCGCGCGCCT TGCCGCGATC GGGAACTGCG TCGCCGTCCT CGATGAACTT 
TGCAAGGGGG ATCTGTCGCA ATGGTGA

Protein sequence

MDRDSELFDL IGDLIMCHSP SGVEARIDAF LLQRLSELGI EAALDAAGNV VARIPGSGAG 
KLAITAHKDE IGASVSTVGD DGRLRLRALG SSFPWVYGEG IVDILGDNET IQGVLSFGSR 
HITRASPQYP QQETAPVKWS DVWVETKCSC DDIAKAGVRP GSRVLVARHR KAPYRLGDHI 
AGYTLDNKAS VAVLIELAKR IRNPVSEICL VFSSMEEVGA CGALYFTRNE PVDAIIALEI 
APLSDEYDIV DGPDPVIYAQ DGYGLYHEGL NGRIAAAAAR AGVGLQRSVV HDFGSDASIV 
MRNGHAPRGA CLAFPTQNTH GYEIARLAAI GNCVAVLDEL CKGDLSQW