Gene Pden_0239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pden_0239
Symbol
ID	4580819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Paracoccus denitrificans PD1222
Kingdom	Bacteria
Replicon accession	NC_008686
Strand	-
Start bp	219738
End bp	221327
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	64%
IMG OID	639767554
Product	extracellular solute-binding protein
Protein accession	YP_914049
Protein GI	119382993
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.884064
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGATCA ATCGTCGCAG AATCCTGCAC ATGTCCGTCG CGGCGGCAGC GGCAAGCCTT 
GCCGGTCCGG GACTGCTGCG CGCGCAGGGA TCGGACCGCC CGATCCGCAT CGCGCTTGCC 
GCCACATCGC CGCGCGCGAT CGACCCGATC TTCAGCACGC TCGGGGCCGA CAACTGGGTC 
AACCTCCAAG TCTATGAGCA TCTCGTCTCG CCGCCGAATG GCAGATTCGC GACCCAGGAC 
GACGAATATC GCCCGATGCT TGCCGAAAGC TGGACCAAGT CCGACGATGC CCGGACATGG 
ACCTTCAAGC TGCGCAGGGA TGTCGCGTTC CACGGCGGCC ATGGCACGCT GACCCCCGAG 
GACGTGGTGT TCACCTTCGA ACGCGCCATG CGTGAAGGCA TCGCCACGGC ATCCTATGCC 
AATGTGCGGG GCGTCGCCGC CTCGGGCCCC GACGAGGTGA CGTTCACGCT GAACGGGCCG 
GATCCGTTTT TCCTGGGGGG CGTGATCTCG ATCCCCAGTT CGCTGATCGT GTGCAAGAGC 
GCGGTCGAGG AGAAGGGCGA GAATTTCGGC AAGGAACCCG TCGGCACCGG CCCCTATGCG 
GTCGAACGCA TGTCAAGCAG CGGCGTCAAT ACCCTGCGCT TCGACGGCTA TTGGGGCGAG 
CCTCCGAAGA CCGCGCGGAT CGACTTCCTC TATACCTCGG ATACGACCTC GCGGACGCTT 
TCGCTGATGT CGGGCGACGT GGACATGATC GAGGCGGTGC GCGCGCCCGG ATGGGTGCAG 
CAGATCCGGC AGCAGAACGA CGCGCTGATC GTCGATCAGA CGCAGCCGGG ATCCTTCAAC 
ACCCTTTTCT TCAACCTGAC CAAGGCACCC TTCGACAATC CGCTGGTGCG CAAGGCGGTC 
GCCACCGCGA TCGACAGCGC GGTGGTCGCC CAGGCGCTGG CCCCGTTCGG CGCACAGACA 
TGGACGCTCT CGCCGCCCGA CTATCCCTCT GGCTGGGCCG CGGAAGATCT GCCCGAGGAT 
CTGCGCTATG ATTACGATCC CGATCGCGCG CGCGAATTGC TGGCCGAGGC CGGGCACGGA 
AACGGGCTGA ACTTCACCGC CAGCATCAGC CAACGCGAGG ATTACCGCTC GATCATGCTG 
ATCCTGCAAG AGCTGATGCG CCCGGCCGGG ATCAACATGA ACCTGAACAT CATGGATCAC 
GCGGCCTTCC ACGGCGCCAA TCGGCAGGAT GCCAACTCGC TGGTGCTGTA TTCGCAAAGC 
CTTCCCCCGG TGCCGCTGGA ATACATGTCG CGCTACCTGT CCTCTGCGGC GGTGGTGAAA 
TCCGATGGGA CCGGCGGCGA CAACTTCAGC CATTACGGCA TCGCCATGCC CGGCGTGGAC 
GACCGGATCG AGGCGATGCG CCAGGCCACC ACGGTCGAGG AATATTCCTC GATCGGACGC 
GAGATCGAGA AGAAGGTGCA AGAGGATCTG CCCCTTATGG GGGTCGGCAA CCTTGGCTAT 
GCCATCGTCC GCAATCCCGC AGTCGATATC GGCTACCAGG TCGAAAGCGG CTATGCGCGC 
TGGCGCCTGG ATCTGGCGCA GCGCGCCTGA

Protein sequence

MLINRRRILH MSVAAAAASL AGPGLLRAQG SDRPIRIALA ATSPRAIDPI FSTLGADNWV 
NLQVYEHLVS PPNGRFATQD DEYRPMLAES WTKSDDARTW TFKLRRDVAF HGGHGTLTPE 
DVVFTFERAM REGIATASYA NVRGVAASGP DEVTFTLNGP DPFFLGGVIS IPSSLIVCKS 
AVEEKGENFG KEPVGTGPYA VERMSSSGVN TLRFDGYWGE PPKTARIDFL YTSDTTSRTL 
SLMSGDVDMI EAVRAPGWVQ QIRQQNDALI VDQTQPGSFN TLFFNLTKAP FDNPLVRKAV 
ATAIDSAVVA QALAPFGAQT WTLSPPDYPS GWAAEDLPED LRYDYDPDRA RELLAEAGHG 
NGLNFTASIS QREDYRSIML ILQELMRPAG INMNLNIMDH AAFHGANRQD ANSLVLYSQS 
LPPVPLEYMS RYLSSAAVVK SDGTGGDNFS HYGIAMPGVD DRIEAMRQAT TVEEYSSIGR 
EIEKKVQEDL PLMGVGNLGY AIVRNPAVDI GYQVESGYAR WRLDLAQRA