Gene Pden_3547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pden_3547
Symbol
ID	4582102
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Paracoccus denitrificans PD1222
Kingdom	Bacteria
Replicon accession	NC_008687
Strand	+
Start bp	694964
End bp	696325
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	66%
IMG OID	639770860
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_917313
Protein GI	119386258
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR01015] homogentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.294103
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGC ACGACCTGCC CCCCGGCATG ACCCGCGCCG CCGTCGCCAC CGGCACGCAT 
CCGGGCTACA TGCCCGGCTT CGGCAACGAT TTCGAGACCG AGGCGCTGCC CGGCGCCCTG 
CCGCAGGGCC AGAACAGCCC GCAGAAATGC GAATACGGGC TTTATGCCGA GCAGCTGTCG 
GGCACCGCCT TCACCGCGCC GCGCGGCCAG AACGAGCGGA CCTGGTGCTA TCGCATCCGG 
CCCTCGGTCC GCCATACCGG CGATTTCGCG GCGATCGATC TGCCGCATTG GAAGACGGCG 
CCGAACCTGC GCGACGACAT CGTCAGCCTG GGCCAGTATC GCTGGGACCC GATCCCGGTC 
CCGGAGGAGG AGCTGACCTG GATCACCGGC ATGCGCAGCA TGACCACGGC CGGCGACGTG 
AACATCCAGG TCGGCATGGC GTCGCATGTC TACCTGGTCA CCCGCTCGAT GCAGGACGAA 
TATTTCTTCT CGGCCGACAG CGAGTTGCTG GTGGTCCCGC AAGAGGGCCG GCTGCGCTTC 
TGCACCGAGC TGGGGGTGAT CGACCTGGAG CCGCGGGAAA TCGCCATCCT GCCGCGCGGC 
CTGGTCTACC GCGTCGAGGT GCTGGAGGGC CCGGCCCGCG GCTTCGTCTG CGAGAATTAC 
GGCCAGAAGT TCGACCTGCC GGGCCGCGGC CCGATCGGCG CCAATTGCCT GGCCAATCCG 
CGCGACTTCA AATGCCCGGT CGCCGCCTTC GAGGACCGCG AGGCGCGCTC GCGCGTGGTG 
ATCAAGTGGT GCGGCCGGTT CCACGAGACC TGGATCGACC ACAGCCCGCT GGACGTGGTG 
GCCTGGCACG GGAATTACTG CCCCTACAAA TACGACCTGC GCACCTATTC GCCGGTGGGC 
GCGATCCTGT TCGACCATCC CGACCCGTCG ATCTTCACCG TGCTGACCGC GCCCTCGGGC 
CAGGAGGGCA CGGCGAATAT CGACTTCGTG CTGTTCCGCG AGCGCTGGAT GGTGGCCGAG 
CACAGCTTCC GCCCGCCCTG GTATCACAAG AACATCATGT CCGAGCTGAT GGGCAACATC 
TACGGCATCT ACGACGCCAA GCCGCAGGGC TTTGCGCCGG GCGGCATCAG CCTGCACAAT 
TGCATGCTGC CGCACGGCCC GGACCGCGAC GCCTTCGAGG GCGCCAGCAA CGCCGATCTG 
AAGCCCGAGA AGCTGGAGGA GACCATGAGC TTCATGTTCG AGACCCGCTT TCCCCAGCAC 
CTCACCGAAT TCGCTGCGCG CGAGGCCCCG ATGCAGAAGG ACTATATCGA AGTCTGGAAC 
CGGCTCGAGA AGAAGTTCGA CGGAACGCCA GGCGTCAAGT GA

Protein sequence

MTQHDLPPGM TRAAVATGTH PGYMPGFGND FETEALPGAL PQGQNSPQKC EYGLYAEQLS 
GTAFTAPRGQ NERTWCYRIR PSVRHTGDFA AIDLPHWKTA PNLRDDIVSL GQYRWDPIPV 
PEEELTWITG MRSMTTAGDV NIQVGMASHV YLVTRSMQDE YFFSADSELL VVPQEGRLRF 
CTELGVIDLE PREIAILPRG LVYRVEVLEG PARGFVCENY GQKFDLPGRG PIGANCLANP 
RDFKCPVAAF EDREARSRVV IKWCGRFHET WIDHSPLDVV AWHGNYCPYK YDLRTYSPVG 
AILFDHPDPS IFTVLTAPSG QEGTANIDFV LFRERWMVAE HSFRPPWYHK NIMSELMGNI 
YGIYDAKPQG FAPGGISLHN CMLPHGPDRD AFEGASNADL KPEKLEETMS FMFETRFPQH 
LTEFAAREAP MQKDYIEVWN RLEKKFDGTP GVK