Gene Pnap_1543 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_1543
Symbol
ID	4686634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	+
Start bp	1631845
End bp	1632837
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	61%
IMG OID	639834546
Product	sulfate ABC transporter, periplasmic sulfate-binding protein
Protein accession	YP_981778
Protein GI	121604449
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.513686
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCAA AATTAAAAAC ACTCCTGGCC GCACTTGCGC TGGCCACGGG CGGCCTGGCA 
TCAAGCCAAA CCCTGCTGAA CGGCTCGTAT GACGTGGCGC GCGAGTTCTA CAAGGACTAC 
AACGCCGCCT TCATCGCCCA CTACAAGAAA ACCACCGGCA AGGACGTGAA GATCGACCAG 
TCGCATGCCG GCTCCAGCGC CGTGGCGCGT TCGGTGGCCG ACGGCCTGGA CGCCGATGTG 
GTGACCATGA ACACCTCGAC CGATGTCGAG TTCCTGGCCA ATGCCGGCGT GGTCGCCAAG 
GACTGGGCCA AGCGCTTTCC GGGCAACGCC TCGCCGACCA CCTCGACCAT GCTGTTCCTG 
GTGCGCAACG GCAATCCCAA GGGCATCAAG GACTGGGACG ACCTGACCAA GCCAGGCATC 
CAGGTGATCG TGGTCAACCC CAAGACCGGC GGCAATGGCC GCTACACCTA CCTGGCCGCC 
TGGGGCTACG CCAAGAAGAA GGGCGCGACC GATGCGCAGG CCGCCGAGTT TGTCGGCAAG 
CTGTACAAGA ATGTTCCGGT GCTGGGCAAG GGCGGGCGCG ACGCGACCAC GGCCTTTTTG 
CAGCGCAACA TTGGCGACGT GCTGGTGACC TTCGAATCCG AAGTGGTGTC GGTCAACAAG 
GAGTTCGGCG AAGGCAAGGT TGATGCGGTG TACCCGTCCA TCAGCATCCT GGCCGAGAAC 
CCGGTGGCGG TGGTGGAGCG CACCGTGGCC AAGAAGGGAA CGGCTGTATT GGCCAAGGCC 
TACCTGGATT ACCTGTATTC GGATGAAGGG CAGGAAATTG CCGCCAAACA TGCCATGCGT 
CCGTATTCGC AGGCTATCCT GAAAAAGAAC GCCGCTGTTT TCAAGCCCAT CCAGTTGTTC 
ACGGTGCAGG AAATGTTCGG CTCGCTGAGC GAAGCGCAAA AAGTCCACTT CAATGACGGT 
GGCCAGTTCG ACAAGCTCTA CACCGTCCGT TAA

Protein sequence

MTSKLKTLLA ALALATGGLA SSQTLLNGSY DVAREFYKDY NAAFIAHYKK TTGKDVKIDQ 
SHAGSSAVAR SVADGLDADV VTMNTSTDVE FLANAGVVAK DWAKRFPGNA SPTTSTMLFL 
VRNGNPKGIK DWDDLTKPGI QVIVVNPKTG GNGRYTYLAA WGYAKKKGAT DAQAAEFVGK 
LYKNVPVLGK GGRDATTAFL QRNIGDVLVT FESEVVSVNK EFGEGKVDAV YPSISILAEN 
PVAVVERTVA KKGTAVLAKA YLDYLYSDEG QEIAAKHAMR PYSQAILKKN AAVFKPIQLF 
TVQEMFGSLS EAQKVHFNDG GQFDKLYTVR