Gene Pnap_2107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_2107
Symbol
ID	4688716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	-
Start bp	2246034
End bp	2247215
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	61%
IMG OID	639835118
Product	benzoate transporter
Protein accession	YP_982337
Protein GI	121605008
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3135] Uncharacterized protein involved in benzoate metabolism
TIGRFAM ID	[TIGR00843] benzoate transporter

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.07884
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.334527
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAG ACTTTTCCCT GTCAGCCGTC ACGGCTGGAT TCCTGGCCGT GCTGATTTCC 
TATGCCGGTC CGCTGGTGAT ATTTTTCCAG GCCGGCCAAA GTGCCCATGT CTCCGCGGAA 
ATGATGTCGT CCTGGGTCTG GGCCATTTCA ATCGGGGCAG GGGTGTCGGG CATCTTGCTG 
AGCTGGTGGC TCAAGGTGCC GGTCGTGACG GCCTGGTCCG CACCGGGCAC GGCCTTGCTG 
GTGACCTTGT TCCCCGCCAT CACGCTCGGG CAGGCCGTCG GGGCTTACCT GGTGTCGGCG 
GTCATTATTT TCATCATTGG CGTGTCCGGT TATTTTGACA AGCTGGTGCA GGCCATCCCC 
AAAGGCATTG CCAGCGCCAT GATGGCGGGC ATTTTGTTCC AGTTTGGCGT CGGCGCGTTT 
CAAGCGGTCA CAGCGATGCC GCTCATCACC TTTTGCATGA TGGGCACTTA TTTGCTCTTC 
AGGCGCTTGC TGCCGCGCTA TTGCCTGGTG ATTTTGCTGG TGATCAGTCT GGTGCTGGCG 
GTGGCCCTGG AGGGCGTGAG CCTGGCCGGC GTGACATTCA CTCTGGCCAG CCCGGTGTTC 
ATCACACCCG AGTGGACCTG GGGCGCAACC CTGAGCCTGG CGCTGCCGCT GGTGCTGGTC 
AGCGTGACGG GGCAGTTCTT GCCGGGCATG GCCATCTTGC GCAGTTCGGG CTACAGCACG 
CCGGCCCGTC CCATCATCAT CACGACCAGC CTGGCCTCGC TGGGCGTGGC ATTTTTCGGC 
GGCATCACGA TTGTGATTGC GGCCATCACG GCGGCGCTTT GCACTGGCAA GGACGCGCAT 
GAAGACGCCA CAAAACGCTA TGTGGCAGGC ATTGCCAACG GCGTGTTTTA CCTGGTGGGC 
GGCTGCTTTG CCGGCACCAT CATCTTGTTT TTTGCAGCCT TGCCCAAAGC GCTGATCGCG 
GTGCTGGCCG GACTGGCCCT GGTGGGCGCG ATTGGGGGTA GTCTGGCCGG TGCAATGAAC 
GAAGCCGATC ACCGGGAGGC CTCGATCATC ACCTTCTTGG CCACAGCGTC GGGCATGACG 
TTCTGGGGCC TGGGGTCGGC GTTCTGGGGA GTGGTCATTG GCGCGCTAGC CTATTTGCTG 
CTGCATAAGC AATGGTTTCT TCCCGCGAAG GCGAGGCTTT GA

Protein sequence

MKKDFSLSAV TAGFLAVLIS YAGPLVIFFQ AGQSAHVSAE MMSSWVWAIS IGAGVSGILL 
SWWLKVPVVT AWSAPGTALL VTLFPAITLG QAVGAYLVSA VIIFIIGVSG YFDKLVQAIP 
KGIASAMMAG ILFQFGVGAF QAVTAMPLIT FCMMGTYLLF RRLLPRYCLV ILLVISLVLA 
VALEGVSLAG VTFTLASPVF ITPEWTWGAT LSLALPLVLV SVTGQFLPGM AILRSSGYST 
PARPIIITTS LASLGVAFFG GITIVIAAIT AALCTGKDAH EDATKRYVAG IANGVFYLVG 
GCFAGTIILF FAALPKALIA VLAGLALVGA IGGSLAGAMN EADHREASII TFLATASGMT 
FWGLGSAFWG VVIGALAYLL LHKQWFLPAK ARL