Gene Pnap_4147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_4147
Symbol
ID	4685187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008757
Strand	-
Start bp	21312
End bp	22142
Gene Length	831 bp
Protein Length	276 aa
Translation table	11
GC content	62%
IMG OID	639826011
Product	2,3-dihydroxy-2,3-dihydrophenylpropionate dehydrogenase
Protein accession	YP_973176
Protein GI	121582734
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID	[TIGR03325] cis-2,3-dihydrobiphenyl-2,3-diol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.180269
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTGA CAGGTGAAGT GGTATTGATC ACGGGCGGCG CCTCCGGCCT GGGGCGCGCC 
CTGGTGGACC GGTTCGTTGC CGAAGGCGCC AGGGTGGCGG TGCTCGACAA GTCGGCGGAG 
CGGCTCCAGC AAATGGAATC CGACCACGGT GACAAGGTGG TCGGCATCGT CGGCGACGTG 
CGCTCACTGC AAGACCAGAA ACAGGCCGCC GACCGCTGCG TGGCCAAGTT CGGAAAAATC 
GACACCCTGA TTCCCAACGC GGGCATCTGG GACTACTCGA CGGCGCTGGT CGATCTGCCG 
GAAGACCGCA TCGATGCCGC GTTCGACGAG GTCTTTCACA TCAATGTCAA AGGCTATATC 
CACGCCGTCA AGGCCTGTCT GCCGGCCCTG GTCGCCAGCC GTGGCAGCGT GATCTTCACG 
CTCTCGAATG CGGGCTTCTA TTCCAATGGT GGCGGCCCTC TTTACACCGC AGCCAAGCAC 
GCGGTGGTGG GCCTAGTGCG CGAGTTGGCG TTTGAGCTGG CGCCGTACGT GCGCGTCAAC 
GGCGTGGCAC CGGGCGGCAT GAGCACCGAT TTGCGCGGCC CTTCCTCGCT TGGCATGAGC 
GGTCAAGCGA TTTCGACCGT GCCGCTGGCC GACATGCTGG AGTCCGTGCT GCCGATTGGC 
CGCATGCCTG ACACCGAGGA GTACACCGGT GCCTATGTGT TTTTTGCCAC GCGAGGCGAT 
ACGGTACCCG CTACCGGCGC CTTGCTGAAC TACGACGGCG GCATGGGCGT GCGTGGATTT 
TTCTCGGCAG CAGGGGGCAA GGACTTGCTC GAAAAACTGA ATATCAAATA A

Protein sequence

MKLTGEVVLI TGGASGLGRA LVDRFVAEGA RVAVLDKSAE RLQQMESDHG DKVVGIVGDV 
RSLQDQKQAA DRCVAKFGKI DTLIPNAGIW DYSTALVDLP EDRIDAAFDE VFHINVKGYI 
HAVKACLPAL VASRGSVIFT LSNAGFYSNG GGPLYTAAKH AVVGLVRELA FELAPYVRVN 
GVAPGGMSTD LRGPSSLGMS GQAISTVPLA DMLESVLPIG RMPDTEEYTG AYVFFATRGD 
TVPATGALLN YDGGMGVRGF FSAAGGKDLL EKLNIK