Gene Pnap_3689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_3689
Symbol
ID	4686207
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	+
Start bp	3927720
End bp	3928970
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	62%
IMG OID	639836707
Product	extracellular solute-binding protein
Protein accession	YP_983906
Protein GI	121606577
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGAAAC TTTCCAAGCT GGCTGCGGCC CTTGCCTTGG TGGCCGCTGG CACGGCGGCC 
ATGGCCGGTG AAGTCGAAGT CCTGCATTAC TGGACTTCCG GTGGCGAGGC CAAGTCGGTC 
GCCGAACTGA AAAAAATCAT GGAAGCCAAA GGCCATGTCT GGAAGGATTT CGCCGTAGCG 
GGCGGCGGCG GCGACAACGC GGCCACCGTG CTCAAAAGCC GCGTGGTGTC GGGCAACCCG 
CCCGCAGCCG CCCAGATCAA AGGCCCGGCG ATCCAGGAAT GGGCGGCTGA AGGCGTTCTG 
GCCAACATGG ACCCTGTCGC CCAGGCCGAA AAGTGGGACA GCCTGCTGCC CAAGGTGGTG 
GCCGACGTCA TGAAGTACAA AGGCAATTTC GTGGCGGTTC CCGTCAACGT GCACCGCGTG 
AACTGGATGT GGGCCAACGC CGCCGTGCTG AAAAAAGCCG GGGTCGCGGG CATGCCCAAG 
AATTGGGACG AGTTCTTTGT CGCGGCCGAC AAGATCAAGA AAGCAGGGCT GATTCCGGTC 
GCCCACGGTG GCCAGAACTG GCAGGACTTC ACCACCTTCG AGTCCGTGGT GCTCGGCGTG 
GGCGGCCCGA AGTTCTACAG CGACGCGCTC GTCAAGCTTG ACCAAAAGGC GCTGACCGGC 
GAGACCATGA AGAAGTCGCT GGAAACCTTC CGCAAGATCA AGGGCTACAC CGACGCTGCC 
GCGCCCGGGC GCGACTGGAA CCTGGCCACC GCCATGGTGA TGCAGGAAAA AGCGGCCTTC 
CAGTTCATGG GCGACTGGGC CAAGGGCGAG TTCATTGCGG CCGGCAAGGT GCCCGGCAAG 
GACTTCCTGT GCGCCGCCGC CCCCGGCACC GCCAATGCGT TCACCTTCAA TGTGGACTCG 
TTTGCCATGT TCAAGCTCAA AGGCGCCGCA GCGCAAAAGG CGCAGGCGGA TTTGTCGGCG 
GCCATCATGG GCACGGAATT CCAGGAGATT TTCAACCTGA ACAAGGGCTC GATTCCGGTG 
CGCCTGAACA TGAACATGGC CAAGTTCGAC GACTGCGCCA AGCTGTCCGG CAAGGACTTT 
GTCGAGACCG CCAAAACCGG CGGGCTGGTG CCCTCGGCGG CCCACGGCAT GGCCATCAGC 
CCTGCGGCTG AAGGCGCCAT CAAGGACGCG GTCAGCCAGT TCTGGAACGA CGACAAGATC 
TCGGTGGACG AGGCGCAAAA GCGCATCGCT GCCGCAGCAA AAACCAAATA A

Protein sequence

MLKLSKLAAA LALVAAGTAA MAGEVEVLHY WTSGGEAKSV AELKKIMEAK GHVWKDFAVA 
GGGGDNAATV LKSRVVSGNP PAAAQIKGPA IQEWAAEGVL ANMDPVAQAE KWDSLLPKVV 
ADVMKYKGNF VAVPVNVHRV NWMWANAAVL KKAGVAGMPK NWDEFFVAAD KIKKAGLIPV 
AHGGQNWQDF TTFESVVLGV GGPKFYSDAL VKLDQKALTG ETMKKSLETF RKIKGYTDAA 
APGRDWNLAT AMVMQEKAAF QFMGDWAKGE FIAAGKVPGK DFLCAAAPGT ANAFTFNVDS 
FAMFKLKGAA AQKAQADLSA AIMGTEFQEI FNLNKGSIPV RLNMNMAKFD DCAKLSGKDF 
VETAKTGGLV PSAAHGMAIS PAAEGAIKDA VSQFWNDDKI SVDEAQKRIA AAAKTK