Gene Pnap_1228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_1228
Symbol
ID	4688702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	-
Start bp	1318679
End bp	1320388
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	65%
IMG OID	639834231
Product	sulfatase
Protein accession	YP_981464
Protein GI	121604135
COG category	[R] General function prediction only
COG ID	[COG2194] Predicted membrane-associated, metal-dependent hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.199097
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.54589
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTGC GCTCGACCCT TCCCGATCCA TCCTCCGCCA AACCCGGCAC TCATCCTTCC 
GGTTTGAACA CCGGCATGCG CCCGCTCTGG GTGGTTGTGC TGGCCAGTTT CTGGATCGCC 
ACGGTGTGCA ACGTGGCGCT GTGGCGCACG CTGGCGCGCC TGCCTGACCT GAGCAGCGGC 
CAGGCCATCA CCGTCAGCGT CGCCCTGGCG CTGGTGATCG GGCTGGCGAC GGCGGGCTTG 
CTCAGCCTGC TGGCCTGGCG CTGGACGCTC AAGCCGGTGA TCATGCTTTT TTGCGTGTCG 
GCGGCGTTTG GCGCCTACTT CATGCTGGCC TACGGCATCG TCATCGACAA GACCATGATG 
GTCAACACGC TGCAAACCGA CCTGCGCGAG ACGCGCGACC TGCTCAACTG GCGCCTGCTG 
GCCACGGTGC TGGTGCTGGC GGGGCTGCCC TGCGTGCTGC TGTGGCGCCA GCACATCCGG 
CTGCAAACGT CCACGCGGCA GGCCGTCTCC AACCTGGCAG CCCTGCTGGC CACCTGCGCC 
CTGCTGGTGC TGGTGCTGGT GCTGTTCTTT CAAAGCCTCG CCTCGGTGAT GCGCAACAAC 
ACGCAGCTGC GCTACCTGAT CAATCCGCTC AATTCCTTCT ATGCGCTGGG CTCCATCGCC 
GCCAGGCCGT TCCAGCGCGA CGAGTCCGCC ATCCTGCCTT TGGGCACAGA CGCCAAACTG 
GGCGCCAGCT ACACGGCGCA GGCCAGGCCG CCGCTGCTGC TGCTGGTGCT GGGCGAGACC 
GGGCGCAGCG GCAACTTCGC GGTCAACGGC TACGGCCGCC CGACCACGCC CGGGCTGGCC 
AAGGAGAACA TCGCCAGCCA GCGCAACGCC TGGTCGTGCG GCACCAGCAC GGCAGCTTCG 
GTGCCGTGCA TGTTTTCAAA TTTCGGACGG GCGAACTACG AATCGCGCCC GGCCAATTAC 
GAAGGCCTGA TGGATGTGCT GCAGCACGCT GGCCTGGCCG TTCTCTGGCT GGACAACCAG 
TCGGGCTGCA AGGGCGTCTG CGACCGCATT CCCAATGCCG ACACCAGCCA GCTGAAAGTG 
CCCGGCCTGT GCGATGGCGG CGAATGCTTC GATGAAGTCA TGCTGCACGG CCTGGACGAG 
CGCATCGCCG CCTTGAGCGC CGAGCGCCGG GCCAAAGGCG TGGTAGTGGT GATGCACCAG 
ATGGGCAGCC ACGGCCCGGC GTATTTCAAG CGCTCGCCGG CCGCGTTCAA GAAATTCCTG 
CCCGAATGCA CCAACAATTC GCTGCAAAGC TGCGAGCCGC AAGGGCTGGT CAATGCCTAC 
GACAACAGCA TCGTGTATAC CGACCACCTG CTGACATCAA GCATCCAGTG GCTCAAGGCG 
CAAGAATCGC AGAACGCGCC TGCCATGCTC TACCTGGCCG ACCACGGCGA GTCGCTGGGC 
GAGAACAACC TCTACCTGCA CGGCATGCCC TACAGCGTTG CGCCCGACGT TCAAAAGCGC 
GTGCCCTGGA TCACCTGGCT GTCGCCCGGA TTCGAGCAGC GCAGCAAGAT CGCCACGGCC 
TGCCTGCAGC GGCAGCTTGA CGCGCCCATC AGCCACGACA ATTATTTCCA TTCAGTCTTG 
GGCCTGATGA ACGTACAGAC CAGCGCTTAC CAGCCTGCAC TGGATATTTA TGCGCACTGC 
CAGACGGGAG TGCCTCCAGG ACAGCCCTGA

Protein sequence

MLLRSTLPDP SSAKPGTHPS GLNTGMRPLW VVVLASFWIA TVCNVALWRT LARLPDLSSG 
QAITVSVALA LVIGLATAGL LSLLAWRWTL KPVIMLFCVS AAFGAYFMLA YGIVIDKTMM 
VNTLQTDLRE TRDLLNWRLL ATVLVLAGLP CVLLWRQHIR LQTSTRQAVS NLAALLATCA 
LLVLVLVLFF QSLASVMRNN TQLRYLINPL NSFYALGSIA ARPFQRDESA ILPLGTDAKL 
GASYTAQARP PLLLLVLGET GRSGNFAVNG YGRPTTPGLA KENIASQRNA WSCGTSTAAS 
VPCMFSNFGR ANYESRPANY EGLMDVLQHA GLAVLWLDNQ SGCKGVCDRI PNADTSQLKV 
PGLCDGGECF DEVMLHGLDE RIAALSAERR AKGVVVVMHQ MGSHGPAYFK RSPAAFKKFL 
PECTNNSLQS CEPQGLVNAY DNSIVYTDHL LTSSIQWLKA QESQNAPAML YLADHGESLG 
ENNLYLHGMP YSVAPDVQKR VPWITWLSPG FEQRSKIATA CLQRQLDAPI SHDNYFHSVL 
GLMNVQTSAY QPALDIYAHC QTGVPPGQP