Gene Pnap_2944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_2944
Symbol
ID	4687218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	-
Start bp	3100797
End bp	3102455
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	64%
IMG OID	639835951
Product	benzoyl-CoA-dihydrodiol lyase
Protein accession	YP_983164
Protein GI	121605835
COG category	[I] Lipid transport and metabolism
COG ID	[COG1024] Enoyl-CoA hydratase/carnithine racemase
TIGRFAM ID	[TIGR03222] benzoyl-CoA-dihydrodiol lyase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCG CCTCCCGCGT CGAGTACCAG ACCGACCCTT CCCAATACAA GCACTGGAAG 
CTCAGCTTCA ATGGCCCCGT CGCCACGCTG GCGGTGGACA TCGACGAAAA CGCCGGCTTG 
CGCCCCGGCT ACAAGCTCAA GCTCAACAGC TACGACCTCG GGGTCGATAT TGAACTGAAC 
GACGCCATCA GCCGCATCCG TTTCGAGCAC CCGGAAGTGC GCACCGTGGT GGTGACCAGC 
GCCAAAGAAA AAGTGTTCTG CTCCGGCGCC AACATCTTCA TGCTGGGCGT GAGCAGCCAC 
TCCTGGAAAG TGAACTTCTG CAAGTTCACC AACGAAACCC GCAACGGCTT GGAAGACTCG 
TCCCGCTACA GCGGCCTGAA GTTCCTCGCT GCGGTCAACG GCGCTTGCGC CGGCGGCGGT 
TACGAGCTGG CACTGGCCTG CGACGAGATC ATCCTGATTG ATGACCGCTC CAGCGCCGTC 
AGCCTGCCCG AAGTGCCTTT GCTCGGCGTG CTGCCCGGCA CCGGCGGCCT GACCCGCGTG 
ACCGACAAGC GCCATGTTCG CCACGACCTG GCCGACCTGT TCTGCACCAG CGTCGAAGGC 
GTTCGCGGCC AGAAGGCCAA GGACTGGCGC CTGGTCGATG ACATTGCCAA GGCGGTCGAT 
TTTTCGCAGA AGGTGCAGAC CCGCGCCCTG GCGCTGGCCG AGCAGAGCGA CCGGCCCGCC 
GACGGCAAGG GCGTGGTGTT CAAGCCGCTC AATCGCACGG TCGAAGCCGA TGCGCTGCGC 
TATTCAAATG TGACGGTCGA GATCGACCGC GCCAAGCGCA CCGCCACCTG GACGGTCAAG 
GCGCCCACGG GTGCGCAACC CTCAAGCATC GCCGGCATTG AAGCGCTGGG CGCCGACTGG 
TTCCCGCTGG TGATGGCGCG CGAACTGGAG GACGCCATCC TGATGATGCG CACCAACGAG 
CTGGAAATCG GCACCTGGCT GATCAAGACC GAAGGCGATG CGGCTGCCGT GCTGGCCATG 
GACGACGTGC TGCTGGCGAA CCAGAAGCAC TGGCTGGTGC GCGAGACCAT CGGCCTGCTG 
CGCCGCACGC TGAGCCGCCT GGACCTGTCC TCGCGCAGCC TGTTCGCGCT GATCGAGCCG 
GGTTCGTGCT TTGCCGGCAC CTACCTGGAA CTCGCCCTGG CCTGCGACCG CAGCTACCAC 
CTTGCCCTGC CCGACGACGA GGACCGTGCG CCCAAAATCA CCGTGGCCGA GACCAATTTT 
GGCCTCTACC CGATGGTGAC TGACCAGAGC CGCCTGGGCC GCCGTTTTTA TGACGAAGCA 
CCGGCGCTCG AAGCCGTGCG CGCCAAGGCG GGCCAGCCGC TGGATGCCGA CGCCGCGTTT 
GCGATTGGCC TGGTCACGTC CAATCCGGAC GACATCGACT GGACTGACGA GGTGCGCATT 
GCCATCGAGG AACGCGTGTC CATGTCGCCC GATGCACTGA CCGGCATGGA AGCGAATTTG 
CGCTTCAACG GCACCGAGAA CATGTTCACC CGCATTTTTG GCCGCCTGAC CGCCTGGCAG 
AACTGGATTT TCCAGCGCCC GAACGCCGTC GGAGAAAAAG GCGCGCTCAA GGTCTATGGC 
AAGGGCGACA AGTCCCAGTT TGACTGGAAC CGCGTCTAA

Protein sequence

MTIASRVEYQ TDPSQYKHWK LSFNGPVATL AVDIDENAGL RPGYKLKLNS YDLGVDIELN 
DAISRIRFEH PEVRTVVVTS AKEKVFCSGA NIFMLGVSSH SWKVNFCKFT NETRNGLEDS 
SRYSGLKFLA AVNGACAGGG YELALACDEI ILIDDRSSAV SLPEVPLLGV LPGTGGLTRV 
TDKRHVRHDL ADLFCTSVEG VRGQKAKDWR LVDDIAKAVD FSQKVQTRAL ALAEQSDRPA 
DGKGVVFKPL NRTVEADALR YSNVTVEIDR AKRTATWTVK APTGAQPSSI AGIEALGADW 
FPLVMARELE DAILMMRTNE LEIGTWLIKT EGDAAAVLAM DDVLLANQKH WLVRETIGLL 
RRTLSRLDLS SRSLFALIEP GSCFAGTYLE LALACDRSYH LALPDDEDRA PKITVAETNF 
GLYPMVTDQS RLGRRFYDEA PALEAVRAKA GQPLDADAAF AIGLVTSNPD DIDWTDEVRI 
AIEERVSMSP DALTGMEANL RFNGTENMFT RIFGRLTAWQ NWIFQRPNAV GEKGALKVYG 
KGDKSQFDWN RV