Gene Pnap_4068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_4068
Symbol
ID	4689055
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	+
Start bp	4342068
End bp	4343312
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	69%
IMG OID	639837081
Product	allantoate amidohydrolase
Protein accession	YP_984280
Protein GI	121606951
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCCAG TACATAACCT GAAAATCAAC CCCCAGCGGC TGGCGCAAAG CCTGGCGGCG 
CTGGGGCAAG TCGGCACGCT GGAGGGCGGC GGCGTGAACC GGCTGGCCCT CACCGAGGCC 
GACCGGCTCG GCCGCGAATG GACGCTGGCG CGCATGCGCG AGCTGGGCAT GGCCGTCACC 
ATCGACGCCA TCGGCAACGT CACTGCCATC TATGCCGGCA CCGAAGACCT GCCGCCGGTG 
ATGACCGGCT CGCATATTGA CACCGTGCGC ACCGGGGGGC TGTACGACGG CAACTACGGC 
GTTCTGGCCG GCCTGGAAGT GGTGGCCACG CTGCGCGATG CCGGTGTGCG GCCGCGCCGG 
CCGATTGCGG TCGCGTTCTT CACCAACGAG GAAGGCGCGC GCTTTCAGCC CGACATGATG 
GGCAGCCTGG TGTATGTCGG CGGCCTGCCG CTGGCGCAGG CGCTGGCCAC CCGCGCCGCA 
GACGGCCACA CCGTGGAAGA AGAACTGCAG CGTATAGGCT ACCGGGGACC GGCGGCCGTC 
GGCTGCCCGG TGGTGGACAG CTTCGTGGAG CTGCACATCG AGCAGGGTCC GGTGCTGCAC 
CAGCAAGGCC TGCAGATTGG CGTGGTCGAG GGCGTTCAGG GCATCTCGTG GACCGAGTTC 
ACGATTGAAG GCGTGTCCAA CCATGCCGGC ACGACGCCTA TGGCCCTGCG CCATGACGCG 
GGCGTGGTGG CGGTGCGCAT CGCGGCTTTT GTTCATGACC TGGCCTTGCG TTACGGCGGC 
CGCCAGCTGG CGACCGTGGG CTCGATGCAG CTGTCGCCCA ACCTGGTCAA CGTCATTGCC 
CAGCGCGCCG TGTTCACGGT GGACCTGCGC AACACCGACG AGGCCACGCT GGCCTGCGCC 
GAGGCCGAGG TGCATGCGTT CGCCGCGCAG TGCGCGGCTG CGCAAGGCGT TGCGTGCAGC 
CAGCGGCGCC TGGCGCGCTT CGAGCCGGTG GCGTTCGACC CGCTGGTGGT TAGCCTGATC 
GAGCAGGAAA CCCGGGCGCT GGGCCTGTCC GCCCTGCGCC TGCCCAGCGG CGCCGGACAC 
GACGCGCAGA TGCTGGCGCG GGTCTGCCCC GCCGGGATGA TCTTCGTGCC CAGCGTCAAT 
GGACTGAGCC ACAACGTGAA CGAGTTCACC GAGCCCGACG ACCTGGCGCA GGGCGCGCAG 
GTCTTGCTGC AGGTGCTGAT GCGGCTGGCC CAGCGTGGTG TTTGA

Protein sequence

MSPVHNLKIN PQRLAQSLAA LGQVGTLEGG GVNRLALTEA DRLGREWTLA RMRELGMAVT 
IDAIGNVTAI YAGTEDLPPV MTGSHIDTVR TGGLYDGNYG VLAGLEVVAT LRDAGVRPRR 
PIAVAFFTNE EGARFQPDMM GSLVYVGGLP LAQALATRAA DGHTVEEELQ RIGYRGPAAV 
GCPVVDSFVE LHIEQGPVLH QQGLQIGVVE GVQGISWTEF TIEGVSNHAG TTPMALRHDA 
GVVAVRIAAF VHDLALRYGG RQLATVGSMQ LSPNLVNVIA QRAVFTVDLR NTDEATLACA 
EAEVHAFAAQ CAAAQGVACS QRRLARFEPV AFDPLVVSLI EQETRALGLS ALRLPSGAGH 
DAQMLARVCP AGMIFVPSVN GLSHNVNEFT EPDDLAQGAQ VLLQVLMRLA QRGV