Gene Pnap_3065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_3065
Symbol
ID	4686807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	-
Start bp	3238292
End bp	3239767
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	63%
IMG OID	639836078
Product	protease Do
Protein accession	YP_983285
Protein GI	121605956
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAGAC TGATGAAGAT GCTTGAATTG AACCTGAAAC CCCTGCGCCC TTACCTGACC 
GCAGGCCTGA TGGCGATTGC GGCCACCACT GCCGTCCTGC CGGTGACGCC GGTGTGGGCG 
CAGACCCGCA CGCTGCCTGA CTTTACCGAT CTGGTGGACC AGGTGGGGCC GTCGGTGGTC 
AACATCCGGA CCCTGGAAAA AGTCAAGGCA TCGGCCGCAG GAAATATTGA CGAGCAGATG 
CTGGAGTTTT TCAAGCGCTT CGGCATTCCC GTGCCGCCCA ACACACCGCG CGCGCCGCGC 
CCTGATCCGA GCCAGCCGGA CGAAGACCAG CCGCGTGGCG TGGGCTCGGG ATTCATCCTC 
ACGACGGACG GCTTTGTCAT GACCAATGCC CATGTGGTCG AAGGTGCGGA TGAAGTCCTC 
GTCACCCTGA CGGACAAGCG CGAATTCAAG GCCAGGATCA TTGGCGCCGA CAAGCGCAGC 
GATGTGGCTG TGGTCAAGAT CGAGGCAACC GGCCTGCCGG CCGTCAAGAT TGGCGACCTG 
GGCCGTCTGC GGGTGGGCGA GTGGGTGATG GCCATCGGTT CGCCGTTCGG GCTTGAAAAC 
ACGGTGACGG CCGGCATCGT GAGCGCCAAG CAGCGTGACA CCGGCGACTA TCTGCCTTTT 
ATCCAGACCG ATGTGGCCAT CAATCCCGGC AACTCGGGCG GCCCGCTGAT CAACATGCGC 
GGCGAGGTCG TCGGCATCAA CAGCCAGATC TATTCACGTT CCGGCGGCTT CCAGGGTATT 
TCGTTCTCCA TCCCGATTGA CGAGGCGATG CGCGTGTCGG AACAACTGCG CATCAGCGGC 
AAGGTGACGC GCGGTCGCAT CGGCGTGCAG ATTGACCAGG TGACCAAGGA CGTGGCCGAA 
TCCATCGGCC TGGGCAAGGC GCAGGGCGCG CTCGTCAGGG GCGTGGAGAG TGACGCCCCT 
GCCGAGAAAG CCGGCATCGA AGCGGGCGAC ATCATCACCA AGTTTGAAGG CCGGCCGATT 
GACAAGGCCA GCGACCTTCC GCGCATGGTC GGCAATGTCA AGCCGGGCAC CAAGGTGACA 
GTGACCGTGT TCCGGCGCGG CGCCACCAAA GACCTGTCAG TCACCATTGC CGAAGTCGAG 
GCCGACAAGC CTGCCCGCCC GGCTGCCAAG TCCGAATCCA AGCCGCCTGT GGCCGGTCCC 
GCGCAGGCAT TGGGCCTGGC GGTGAGCGAG ATCACGGATG CACAGAAAAA GGAACTCAAT 
GTCAAGGGCG GCGTCAAGGT CGATACGGTC GATGGCGCGG CCGCAAGAGC GGGACTGCGC 
GAAGGCGATG TGATTGTGTC GATTGCCAAC ACGGAGGTGA CCGGCGTCAA GGGATTCGAG 
GCGGCGCTGG CAAAAATTGA CAAGTCCAAA AACATCACCG TGCTGGTCCG GCGCGGTGAA 
CTGGCGCAAT TTGTCATCAT CAAGCCGGCG CGTTGA

Protein sequence

MMRLMKMLEL NLKPLRPYLT AGLMAIAATT AVLPVTPVWA QTRTLPDFTD LVDQVGPSVV 
NIRTLEKVKA SAAGNIDEQM LEFFKRFGIP VPPNTPRAPR PDPSQPDEDQ PRGVGSGFIL 
TTDGFVMTNA HVVEGADEVL VTLTDKREFK ARIIGADKRS DVAVVKIEAT GLPAVKIGDL 
GRLRVGEWVM AIGSPFGLEN TVTAGIVSAK QRDTGDYLPF IQTDVAINPG NSGGPLINMR 
GEVVGINSQI YSRSGGFQGI SFSIPIDEAM RVSEQLRISG KVTRGRIGVQ IDQVTKDVAE 
SIGLGKAQGA LVRGVESDAP AEKAGIEAGD IITKFEGRPI DKASDLPRMV GNVKPGTKVT 
VTVFRRGATK DLSVTIAEVE ADKPARPAAK SESKPPVAGP AQALGLAVSE ITDAQKKELN 
VKGGVKVDTV DGAAARAGLR EGDVIVSIAN TEVTGVKGFE AALAKIDKSK NITVLVRRGE 
LAQFVIIKPA R