Gene Pnap_3688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_3688
Symbol
ID	4686175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	-
Start bp	3926429
End bp	3927475
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	65%
IMG OID	639836706
Product	aldo/keto reductase
Protein accession	YP_983905
Protein GI	121606576
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTACC AGCCCAACGC AGCCCGCTAT GACACCATGC CCTACCGAAG CTGCGGACGC 
AGCGGCTTGA TGCTGCCCGC CATCACCCTG GGGCTGTGGC ATAACTTTGG CGACGCCACG 
CCCATGGAAA CGCAGCGCGC CATGCTGCGT ACCGCGTTCG ACCTGGGCAT CACGCACTTT 
GACCTGGCCA ACAACTACGG CCCGCCCGGC GGCAGTGCGG AAATCAATTT TGGCGAGCAT 
CTGCGGCGCG ACTTCAAGCC CTATCGCGAC GAACTCATCA TTTCCAGCAA GGCGGGCTGG 
GACATGTGGC CCGGCCCTTA TGGGCAGGGC GGCGGCTCGC GCAAGCATGT GCTGGCCAGC 
CTGGACCAGA GCCTCAAGCG CATGGGGCTT GACTATGTCG ATATTTTTTA TTCGCACCGC 
TTTGACCCCG ACACCCCGCT GGAGGAAACC ATGGGGGCGC TGGCCACGGC GGTTCAGCAG 
GGCAAGGCCT TGTACGTCGG CCTCAGCAGC TACTCGGCGG CCAAGACGAG CGAAGCCGCG 
GCCATTTTGC GTGCCATGGG TGTGGCGCCG TTGATTCACC AGCCCTCTTA CAGCCTGCTG 
AACCGCTGGA TTGAGGGCGA GCTGCTCGAC ACCCTGGCTG AAACCGGCAT GGGCTGCATT 
GCGTTCAGCG CGCTGGCGCA GGGGCTGCTG ACCGACAAGT ACCTGAACGG CATTCCGGCG 
GACGCCCGAA TCAACCGCCC CGGCGGCAGT TCCCTCAAGG CCGAACATCT GAGCGAACAA 
AACCTCAAGC ATGCGCGTGC CCTGAATGAG CTGGCGCTGG CGCGCGGACA GAGCCTGGCC 
CAGATGGCGA CGGCCTGGGT GCTGCGCGAT GGCCGCGTGA CCTCGGCGTT GATTGGCGCC 
AGCCGCCCGG CGCAAATCGC GGAACTGGTC GGCGCGCTGC GCAAGCTTGA GTTTTCCGCC 
GAAGAACTGG CGGCCATTGA CCAGCACGCG GTGGACGGCG GCATCAACCT GTGGCAACGC 
CCCTCGACCG ATCAGCGCCC GGCTTGA

Protein sequence

MNYQPNAARY DTMPYRSCGR SGLMLPAITL GLWHNFGDAT PMETQRAMLR TAFDLGITHF 
DLANNYGPPG GSAEINFGEH LRRDFKPYRD ELIISSKAGW DMWPGPYGQG GGSRKHVLAS 
LDQSLKRMGL DYVDIFYSHR FDPDTPLEET MGALATAVQQ GKALYVGLSS YSAAKTSEAA 
AILRAMGVAP LIHQPSYSLL NRWIEGELLD TLAETGMGCI AFSALAQGLL TDKYLNGIPA 
DARINRPGGS SLKAEHLSEQ NLKHARALNE LALARGQSLA QMATAWVLRD GRVTSALIGA 
SRPAQIAELV GALRKLEFSA EELAAIDQHA VDGGINLWQR PSTDQRPA