Gene Pnap_0041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_0041
Symbol
ID	4689989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	-
Start bp	41693
End bp	42709
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	62%
IMG OID	639833035
Product	aliphatic sulfonate ABC transporter periplasmic ligand-binding protein
Protein accession	YP_980288
Protein GI	121602959
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.487407
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTCTC ATTTCTTCTC GCTTTTCACG ATTTCTCATG CGTTCAAGCG CAGTGTCGCC 
GGCGCCTGCC TGGTGCTGGC AGGCGTGGGT GCGGCCAGCG TGCCGATGCC TGCAGCGGCC 
GAAGTCAAGG TCGGCGTGTC CGACTGGCCA GGCTGGGTGG CCTGGTACGT GGCCGAGCAA 
AAAGGCTTTT TCAAGAAGAA CGGCGCCGAC GTCAAGCTCG TCTGGTTTGC CAACTACACC 
GATTCCATCG GCGCGCTGTC CTCGGGCCAG CTCGACGCCA ACTCCCAGAC CTGGTCCGAC 
ACGCTCGGCC CCCTGGCCAA GGGCCTGCCG CTCAAGGCGA TTCTGGTCAA CGACAACTCG 
GCCGGCAACG ACGCGCTGAT GGTCGGCCCG AAGATCACCT CCTTCGCCCA GCTCAAGGGC 
AAGAAAGTGG CGCTGGAGCA ATTCAGCATT TCGCACTTCG TGCTGGCCAC GGCGCTGGCC 
AAGAACGGCA TGAAGCTCGA TGACGTGAAG ATCGTCAACC TGTCCGCCGG CGACGCCGCC 
GCCGCCTTCA TCAGCGGCAA GGTCGATGCC GCCGTGCTGT GGAACCCCTG GGTGAACCAG 
ATCGAAAAAA GCGGCAAGGG CAAGGCCTTG TTCACCTCCA GGGACATGCC CGGCCTGGTG 
CCCGACTTGC TGGTGGCCCA GGACAAGGCC ATCCAGACCA AGCGCAAGGA GCTGGTCGGC 
ATGATCAAGG CCTGGTTCGA GACCGAAAAG TTCATCCGCG AGCAACCCGC CGAAGCCGCC 
AAAATCATGT CCAAGGTGGT CAGCATGTCG CCCGAGGAAT ACACCGTGTT CCTGCCCGGC 
ACCAGGTTCT TCGACGCCGC CGCCAACACC CGTGCTTTTG ACGCCAAACA GGCGCTGTCG 
CTGTCCAGCA CCGCGCCCAC CATCGCTGCC TTTTTGACCC AGTACAAGCT GATCGAAGGC 
AAGCCTGATG CCGCCAAGGG CATTGACGGC ACGCTGCTGC AAGACGCGTT GAAGTAA

Protein sequence

MSSHFFSLFT ISHAFKRSVA GACLVLAGVG AASVPMPAAA EVKVGVSDWP GWVAWYVAEQ 
KGFFKKNGAD VKLVWFANYT DSIGALSSGQ LDANSQTWSD TLGPLAKGLP LKAILVNDNS 
AGNDALMVGP KITSFAQLKG KKVALEQFSI SHFVLATALA KNGMKLDDVK IVNLSAGDAA 
AAFISGKVDA AVLWNPWVNQ IEKSGKGKAL FTSRDMPGLV PDLLVAQDKA IQTKRKELVG 
MIKAWFETEK FIREQPAEAA KIMSKVVSMS PEEYTVFLPG TRFFDAAANT RAFDAKQALS 
LSSTAPTIAA FLTQYKLIEG KPDAAKGIDG TLLQDALK