Gene Pnap_4021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_4021
Symbol
ID	4686123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	+
Start bp	4286928
End bp	4288373
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	66%
IMG OID	639837035
Product	phenylhydantoinase
Protein accession	YP_984234
Protein GI	121606905
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR02033] D-hydantoinase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATCCA TCTTGATCCG TGGCGGCACC GTGGTGAACG CCGACCGCGC CTTCCGCGCC 
GATGTGCTGA CGCAGGGCGG CCGCATCGCC GCCGTCGGTG AAGCGCTGGA GGCGCCTGCT 
GGCGCCCTGG TCGTCGATGC CGGCGGCCAG TACGTGATGC CCGGCGGCAT CGACCCGCAC 
ACGCATATGC AGCTGCCCTT CATGGGAACG GTGACGATGG ACGATTTCTT CAGCGGCACG 
GCGGCCGGCC TGGCGGGCGG CACCACCAGC ATCATCGACT TCGTGATTCC CGCGCCGCAA 
CAATCGCTGA TGGACGCCTA CCAGACCTGG CGCGGCTGGG CCGAAAAATC CGCCGCCGAC 
TACGGCTTTC ATGTCGCCGT CACCTGGTGG GACGAGTCGG TTCGGCGCGA TATGGGCACG 
CTGGTGCAGC ACGAAGGCGT GAACAGCTTC AAGCATTTCA TGGCCTACAA GAACGCCATC 
ATGTGCGACG ACGAAACGCT GGTGAACAGC TTCAGGCGCT GCCTGGAACT GGGCGCCATG 
CCCACGGTGC ATGCCGAAAA CGGCGAACTG GTGTTCATGC TGCAAAAGGA AATCGCTGCC 
CAGGGCATCA CCGGCCCCGA AGGCCACCCG CTGTCGCGCC CGCCGATGGT CGAGGCCGAG 
GCGGCGAACC GGGCGATTGC GATTGCCGAT GTGCTGAACG TGCCGATCTA CGTCGTGCAT 
GTGTCGTGCG TCGAAGCGCT GGAAGCCATT GCACGCGCCA GAGCCCGCGG CCAGCGCGTC 
TATGGCGAGG TGCTGGCCGG GCACCTGGTG GTCGATGACA GCGTCTACCG CCACCCCGAC 
TTCGCCACCG CCGCCGCGCA TGTGATGAGC CCGCCTTTCA GGCCCAAGGC CAATCAGGAA 
TTCCTGTGGC GCGGCCTGCA GGCGGGCAAC CTGCACACCA CGGCGACCGA CCACTGCACC 
TTCTGCGCCG CGCAAAAAGC GGCGGGCAAG GACGATTTCG CCAAGATTCC GAACGGCTGC 
GGCGGCGTCG AGGAACGCCT GGCCGTGGTC TGGGACGCGG GCGTGAACAC CGGCCGCCTG 
ACGCCCAGCG AATTCGTCGC CGTCACCTCG GCCAACACCG CCAAACTGTT CAACATCTAC 
CCGCAAAAAG GCAGCGTGTC GGTCGGTGCC GACGCCGACC TGGTGGTCTG GGACCCCGAG 
GGCACGAAAA CCCTGTCCGC CAAGACCCAG CACAGCAAGG GCGACTTCAA CATCTTCGAA 
GGCCGCACCG TGCGCGGCAT CCCCAGCCAC ACGCTCAGCC AGGGCGAACT GGTGTTCGTG 
CAGGGCGACC TGCGCGCCGT TCAGGGCAAG GGCCGCTATA TCAAACGGCC GGCTTTTGGA 
GCAAACTTCG CGGCGGCCAA GCTGCGCGCT GAAACGCTGG CACCCAGCCC CGTCGTGCGC 
GCCTGA

Protein sequence

MTSILIRGGT VVNADRAFRA DVLTQGGRIA AVGEALEAPA GALVVDAGGQ YVMPGGIDPH 
THMQLPFMGT VTMDDFFSGT AAGLAGGTTS IIDFVIPAPQ QSLMDAYQTW RGWAEKSAAD 
YGFHVAVTWW DESVRRDMGT LVQHEGVNSF KHFMAYKNAI MCDDETLVNS FRRCLELGAM 
PTVHAENGEL VFMLQKEIAA QGITGPEGHP LSRPPMVEAE AANRAIAIAD VLNVPIYVVH 
VSCVEALEAI ARARARGQRV YGEVLAGHLV VDDSVYRHPD FATAAAHVMS PPFRPKANQE 
FLWRGLQAGN LHTTATDHCT FCAAQKAAGK DDFAKIPNGC GGVEERLAVV WDAGVNTGRL 
TPSEFVAVTS ANTAKLFNIY PQKGSVSVGA DADLVVWDPE GTKTLSAKTQ HSKGDFNIFE 
GRTVRGIPSH TLSQGELVFV QGDLRAVQGK GRYIKRPAFG ANFAAAKLRA ETLAPSPVVR 
A