Gene Pnap_4020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_4020
Symbol
ID	4690002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	+
Start bp	4285556
End bp	4286863
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	66%
IMG OID	639837034
Product	dihydropyrimidine dehydrogenase
Protein accession	YP_984233
Protein GI	121606904
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01037] dihydroorotate dehydrogenase (subfamily 1) family protein

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAACC TGCAAACGAA TTTCATCGGC ATCCACAGCC CCAACCCGTT CTGGCTCGCG 
TCCGCACCGC CCACCGACAA GGCCTACAAC GTGAACCGCG CCTTCGAGGC CGGCTGGGGC 
GGCGTGGTCT GGAAGACGCT GGCCGAGGCC GGGCCGACGC TGGTCAACGT CAACGGGCCG 
CGCTACGGCG CGCTGCTCTC GCCCGACCGA CGGCTCTTGG GCTTCAACAA CATCGAACTG 
ATCACCGACC GCGACCTGGA GATCAACCTG GCCGAAATCA TCCAGGTCAA GCGCGACTGG 
CCCGAGCGCG CGCTGGTCGT CTCGCTGATG GTGCCGTGCA ACGAGGCGGC CTGGAAATCC 
ATCCTGGCGC GCGTCGAGGA CACCGGCGCC GATGGCCTGG AGCTGAACTT CGGCTGCCCG 
CACGGCATGA GCGAGCGCGG CATGGGCTCG GCCGTCGGCC AGGTGCCCGA GTACATCGAG 
ATGGTCACCC AGTGGTGCAA GCACTACAGC CGGCTGCCGG TGATCGTCAA GCTCACGCCC 
AACATCACCG ACATCCGCAT CCCGGCGCGC GCGGCCCGGC GCGGCGGCGC CGATGCGGTG 
TCCTTGATCA ACACCATCAA CTCCATCATG GGCGTCGATC CGTATTCGCT GACCATGCTG 
CCCTCGACCG GCGGCAAGGG CTCGCACGGC GGCTATTGCG GCCCGGCGGT CAAGCCGATT 
GCGCTGAACA TGGTCGCCGA AATCGCCCGC GACCCGCAGA CCGCCGGCCT GCCGATCTCG 
GGCATAGGCG GCGTGGGCAG CTGGCGCGAT GCGCTGGACT ACATCGCGCT GGGCGCGGGA 
ACGGTGCAGG TCTGCACGGC GGCCATGGTC CATGGCTTCA AGATCGTGCA GGAGATGAAG 
AGCGGCCTCT CGGACTACAT GGACGAGATG GGTTTTGCGT CGATTGACGA CTTCCGGGGC 
CGGGCGCTGC CGACCGTGGC CAACTGGAGC GAGCTCAACC TCAACCATGT CTCCAAGGCG 
GTGATCGACC AGGACAGCTG CATTTCCTGC GGCCGCTGCC ACATCGCCTG CGAGGACACC 
TCGCACCAGG CGATCAGCGC CATGAAAGAC GGCAAGCGCC ACTTCGAGGT CAAGGAAGAC 
GAGTGCGTCG GCTGCAACCT GTGCGCGCTG GTCTGCCCGG TGCCCGAATG CATCACGCTG 
CGCGATTTGC AGCCCGGCGA AAAGGACTTG CGCACCGGGC GCATCGTGAG CGATAAACAC 
GCGGACTGGA CGACGCACAC GAACAACCCG ATGCGCATCC CGGTTTAA

Protein sequence

MANLQTNFIG IHSPNPFWLA SAPPTDKAYN VNRAFEAGWG GVVWKTLAEA GPTLVNVNGP 
RYGALLSPDR RLLGFNNIEL ITDRDLEINL AEIIQVKRDW PERALVVSLM VPCNEAAWKS 
ILARVEDTGA DGLELNFGCP HGMSERGMGS AVGQVPEYIE MVTQWCKHYS RLPVIVKLTP 
NITDIRIPAR AARRGGADAV SLINTINSIM GVDPYSLTML PSTGGKGSHG GYCGPAVKPI 
ALNMVAEIAR DPQTAGLPIS GIGGVGSWRD ALDYIALGAG TVQVCTAAMV HGFKIVQEMK 
SGLSDYMDEM GFASIDDFRG RALPTVANWS ELNLNHVSKA VIDQDSCISC GRCHIACEDT 
SHQAISAMKD GKRHFEVKED ECVGCNLCAL VCPVPECITL RDLQPGEKDL RTGRIVSDKH 
ADWTTHTNNP MRIPV