Gene Pnap_3501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_3501
Symbol
ID	4689147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	+
Start bp	3715798
End bp	3716922
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	66%
IMG OID	639836515
Product	putative zinc protease protein
Protein accession	YP_983719
Protein GI	121606390
COG category	[R] General function prediction only
COG ID	[COG4324] Predicted aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0403427
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATCGA GACGATTGAG GCGCCTGCTG GCCGCAGGCC TGGCGGCCGC CGGCCTAACC 
GGCTGCGCCG ACCTGGGCTA TTACTGGCAG TCGGTCAACG GCCACCTGAC GGTGATGAAC 
GCAGCCCGCC CGGTCAAGGA CTGGCTGGAC GATGCGCGCA CCCCGGCGCC GCTGAAAACC 
CGGCTGGCCC TGGCGCAGCG CATCCGCCGC TTTGCCGTCA CCGAACTGCA GCTGCCCGAC 
AACCCGAGCT ACCACCGCTA TGCCGACCTG CAGCGCAGCG CCGTGGTCTG GAACGTGGTC 
GCCGCGCCCG AGTTCTCGCT GACGCTGAAG ACCTGGTGTT TTGCGCTGGC CGGCTGCGTC 
GGCTACCGGG GCTATTTCAG TGAACCGGAT GCCCGGGCCG AGGCCGCGCA ACTCGCCGCC 
CAGGGCTTTG AAACCAGCGT TCATGGGGTG CCGGCCTATT CCACGCTGGG CTGGATGAAC 
TGGGCCGGCG GCGACCCGCT GCTGAGCACC TTCATCCGCT ACCCCGAGGG CGAGCTGGCG 
CGACTGGTGT TTCACGAACT CGCGCACCAG GTGGCTTATG CGCAGGACGA CACGGTGTTC 
AACGAGTCGT TTGCGACGGC CGTCGAGCGG CTGGGCGTGC AGCGCTGGCT GGATGCGCGG 
AGCAGCCAGA GCACCGATGA AGCCCGCCAG GCCTATGCGG CGTTTGACGC ACGGCGCCAG 
CAGTTCCGGG CACTGGCGCA GGCCACACGC CGGGAATTGA CCGCCATTTA TGAACCAAAC 
AAGGCTTTAG TGCACGTCCC ACCTGCGCAA GCAGCTCTTA AAATGATAGC AATGCAGAAT 
TTTCGTGAGC GCTATGCGCA GCTCAAGGCG TCATGGGACG GTTATGCCGG CTACGACCCG 
TGGGTGGCGC GCGCCAACAA TGCGTCGTTT GGCGCGCAGG CAGCCTATGA CGAACTGGTG 
CCCGGTTTTG AAGCCCTGTT CGAGCGCGAA GGACGTGACT GGCCACGGTT TTACGGCGCC 
GTCAAACGGC TGGCCGGCAT GCCCAAGAGC GAGCGGCACG CCCTCCTGGA GATCAATCAC 
GGGCCGGCAA TTGCCGGGAT GGCGGCAGCC CACGCCGGGC AGTAA

Protein sequence

MASRRLRRLL AAGLAAAGLT GCADLGYYWQ SVNGHLTVMN AARPVKDWLD DARTPAPLKT 
RLALAQRIRR FAVTELQLPD NPSYHRYADL QRSAVVWNVV AAPEFSLTLK TWCFALAGCV 
GYRGYFSEPD ARAEAAQLAA QGFETSVHGV PAYSTLGWMN WAGGDPLLST FIRYPEGELA 
RLVFHELAHQ VAYAQDDTVF NESFATAVER LGVQRWLDAR SSQSTDEARQ AYAAFDARRQ 
QFRALAQATR RELTAIYEPN KALVHVPPAQ AALKMIAMQN FRERYAQLKA SWDGYAGYDP 
WVARANNASF GAQAAYDELV PGFEALFERE GRDWPRFYGA VKRLAGMPKS ERHALLEINH 
GPAIAGMAAA HAGQ