Gene Pnap_4043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_4043
Symbol
ID	4687714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	+
Start bp	4309559
End bp	4310542
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	59%
IMG OID	639837056
Product	TRAP dicarboxylate transporter, DctP subunit
Protein accession	YP_984255
Protein GI	121606926
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.187299
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGA TTCGTCTGAT ATTCCTCGCC GGGCTGGCCT GCGCTGCGAT GGCGCACGCC 
GAGCCGATCA CCTTGACGCT TGCGCATGCC ACCATGACCA CGCACCCGGC TCACCTGGCG 
GCGCTGCAGT TTGCCAGGCG GGTCGAAGAG CGCACCAACG GGCAAATCAA GACCGAGATA 
TTCCCGGCGG CTCAGCTCGG CAGCGAAAAC GAAATGCTAA AAAAGGTCAA ACTCGGCGCG 
ATTGACATGG ACGTGTCCAC GCCGAACTAC ATGATCAAGT ACGAAAAGGC CTTCGCGGTC 
GTGGTCATGC CCTACGTATT CGACAACTAC GAGCATGCGC ACCGGGTGCT CGACGGCCCG 
GCGATGGCCT GGCTCGCGCC GCTGGCCGAG AAGCAGGGCT TCGTGATCTT GTCCAACTGG 
GAATGGGGCT TTCGCAACCT GACCAACAAC CAGCGCCCGA TCAACCAGCC CGGGGATGTG 
CGCGGCCTGA AAATACGCGT GCCGCCCGTG GCTGAAGTCG AGACCACCAT GCAGGCGCTG 
GGCGCGCAGG TCAGCAAGAT CAGCTTCAAA GACCTCTACG CAGCGTTGTC GCAAGGACGG 
GTCGATGGCC AGGAAAACCC GCTCAACGTG ATTTATTACA ACAAGCTGTA CGAGGTGCAG 
AAGCACCTCG CGCTGACGCG GCATGTTTAC TACAACACCG TGCACCTGAT CAGCGCCAAA 
AGCTGGGCGA TGCTCACGCC GGCGCAGCAA AAAATTGTGC GCGAAGAAAG CAAGGCGGCG 
GGCGACGGCA TGCGCAAAAA AATCATTGCC GAAGAGGACG AGCTGATCGC CAAAATGGCC 
GCTGCCGGGG TGAAGGTCAC GCGCCCCGAC CTCAAGGCGT TTCGCGCCAC AGTGGAACCC 
GTTTATCAGG AAATTGCCGC CTACACGGGC GAAGCGAATG TGCAAAGGTT TCTGAAAATG 
GTCGAAGATG AGCGCAAGAA ATGA

Protein sequence

MKAIRLIFLA GLACAAMAHA EPITLTLAHA TMTTHPAHLA ALQFARRVEE RTNGQIKTEI 
FPAAQLGSEN EMLKKVKLGA IDMDVSTPNY MIKYEKAFAV VVMPYVFDNY EHAHRVLDGP 
AMAWLAPLAE KQGFVILSNW EWGFRNLTNN QRPINQPGDV RGLKIRVPPV AEVETTMQAL 
GAQVSKISFK DLYAALSQGR VDGQENPLNV IYYNKLYEVQ KHLALTRHVY YNTVHLISAK 
SWAMLTPAQQ KIVREESKAA GDGMRKKIIA EEDELIAKMA AAGVKVTRPD LKAFRATVEP 
VYQEIAAYTG EANVQRFLKM VEDERKK