Gene Pnap_4778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_4778
Symbol
ID	4685995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008761
Strand	+
Start bp	15591
End bp	16838
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	54%
IMG OID	639826767
Product	restriction modification system DNA specificity subunit
Protein accession	YP_973929
Protein GI	121583503
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	0.16943
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	135
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCTG AGTGGCAATT CGGAAAGCTC GGCGACTTCA TTGAACTAAA ACGTGGTTAC 
GATTTACCGC AAGCGAAAAG AACTTCTGGC CCGTTTCCTC TCGTTTCATC CTCCGGTGTT 
AGTGACTGCC ACTCCGTGCC AATGGTGCGA GGGCCAGGCG TGGTCACTGG GCGATACGGA 
ACGATTGGGC AAGTCTATTT TGTTGAAGAT GATTTTTGGC CGCTGAACAC AACCCTTTAT 
GTTCGTGATT TCAAGGGTAA TGACCCAAAG TTCATCAGCT ATTTTTTGAA GACCGTTGAT 
TTTTTCGCCT ATTCAGACAA GGCGGCAGTG CCTGGCGTAA ACAGAAATCA TCTTCATGAA 
GCTCTTGGTG CAATTCCTGA TTTACCCACT CAACAGGAGA TAGCGAGAAC GCTCGGTGTC 
CTGGACGACC GCATCGCCCT GCTGCGCGAA ACCAATGCCA CGCTCGAAGC CATCGCTCAG 
GCGCTGTTCA AGTCGTGGTT TGTCGATTTC GACCCGGTGC GCGCCAGGAT GGAAGGCCGC 
GCCCCCGAAG GCATGGACGA GGCCACGGCG GCGCTGTTTC CGGATGGGTT CGAGGATTCG 
GAGCTGGGAT TGGTGCCGAA GGGGTGGGCG ACACGCACTA TGGCGGATAT ATCAACCGTG 
GGGATTGGAA AGACACCTCC TCGCAAGGAA CAACATTGGT TCAGCGAAGA CCCAAGCGAT 
GTTCGATGGG TTTCCATTCG CGATATGGGC GCTGTTGGGG TTTACGCCGC AGTGACCAGC 
GAGTTTCTGA AGAAAGAGGC CATTGAAAAG TTCAACATCC GACGAGTGCC TGACAACACG 
GTATTGATGA GCTTCAAGAT GACCATTGGC CGCGTGGCAA TTACCGATGG CGAAATGACA 
ACCAACGAAG CCATTGCCCA CTTCAAACTG GCCCCGGATG CACAGTTGAG CACAGAGTAC 
ATCTATCTGC ATTTGAAACA GTTCGACTTC TCCACTTTGA GCAGCACATC CTCGATTGCA 
GATGCCGTCA ACTCCAAGAC CGTGCGCGAA ATTCCAATAC TAATGCCGAG CCTTGAAGGC 
TTGACTGCAT TCCAAAGCCA AGTCGCAGCG CTCTTTGCGA AACTGAAAAA TACAGAACAG 
CACGCCCAAA CCCTCGTCAC ACTGCGCGAC ACCCTGCTCC CACGCCTGAT CTCGGGCCAG 
CTGCGCCTGC CCGAAGCCGA GGCGCTGCTC GAAGAAGCCT GCGCATGA

Protein sequence

MSSEWQFGKL GDFIELKRGY DLPQAKRTSG PFPLVSSSGV SDCHSVPMVR GPGVVTGRYG 
TIGQVYFVED DFWPLNTTLY VRDFKGNDPK FISYFLKTVD FFAYSDKAAV PGVNRNHLHE 
ALGAIPDLPT QQEIARTLGV LDDRIALLRE TNATLEAIAQ ALFKSWFVDF DPVRARMEGR 
APEGMDEATA ALFPDGFEDS ELGLVPKGWA TRTMADISTV GIGKTPPRKE QHWFSEDPSD 
VRWVSIRDMG AVGVYAAVTS EFLKKEAIEK FNIRRVPDNT VLMSFKMTIG RVAITDGEMT 
TNEAIAHFKL APDAQLSTEY IYLHLKQFDF STLSSTSSIA DAVNSKTVRE IPILMPSLEG 
LTAFQSQVAA LFAKLKNTEQ HAQTLVTLRD TLLPRLISGQ LRLPEAEALL EEACA