Gene Pden_5072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pden_5072
Symbol
ID	4583633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Paracoccus denitrificans PD1222
Kingdom	Bacteria
Replicon accession	NC_008688
Strand	+
Start bp	584405
End bp	585964
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	66%
IMG OID	639772375
Product	extracellular solute-binding protein
Protein accession	YP_918828
Protein GI	119387794
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.236333
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.758542
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTCA ATCCGACGGG GCAGGGGCTG ACCAGGCGGG GCTTGCTGGC CGGCGCGGCA 
GGCATGGCGG CGGCGGGGCT GATCCTGCCG CGCGGCGCGC GCGCGCAGGA GGCGCGGCGC 
GGCGGCAGGC TGCGCATCGG CCATCTGGGC GGCGCGACCT CGGACACGCT GGACCCGGCG 
ACCTATGCCG CGGGGCCGGT GGTGACGGCG ATGCTGGCGG TCTGCAACAA CCTGGTCGAG 
ATCGACGCCA AGGGCCAGGC CGTGCCCGAA CTGGCCGAGT TCGAGCCCGA TGCCGAGGCC 
CGCGTCTGGA CCTTCCGCCT GAAGGACGGC GTCACCTTCT CGGACGGGCG CAAGCTCACG 
GCCAGGGACG TGATCGCGTC CTTCGACCAT CATCGCGGCG CCGATACCAA GTCCGGCGCC 
AAGGGCTCGC TTGAGCAGGT CAAGGAAATC CGCGCCGATG GCGACAATGT CGTGGTCTTC 
GAACTGACCT CGGGCAATGC CGATTTCGCC TATCTGACCT CGGACTATCA CTTCGTCATC 
ATGCCGGCGA ACGAGGACGG CACGCTGGAC TGGCAGTCGG GTCTGGGCAC CGGCGGCTAT 
GTGCTGGAGA ACTTCGAGCC GGGCGTGCGC ATCACGCTCA AGCGCCGCGA CGACTACTGG 
AAGCCCGACC GCGCCTGGTT CGACGAGGCG GTGCTGCTGA CCATCAACGA TGCCACCGCC 
CGGCAGAATG CGCTGATGAC CGGCGAGGTC GATGTCATCA ACTCGCCCGA CCTGGCTACC 
CTGCACCTGT TGCAGCGCCG GCCGGGCCTG CAACTGGTCG AGGTGACGGG GACCGCGCAT 
TACACCATGC CGATGTTCTG CGACCAGGCG CCCTTTACCG ATCCGAACCT GCGGTTGGCG 
CTGAAATACG CCATCGACCG GCAGGAGGTG CTGGACAAGG TGCTGCGCGG CCATGGCCAG 
ATCGCCAATG ACAGTCCCAT CGCGCCGGCG AACCGCTTCT TTGCCGCCGA CCTGCCGCAG 
CGGGCCTATG ACCCGGACAA GGCGAAGCAT TACCTGAAAC AGGCCGGCAT GGAGGGGCTG 
AAGGTCGAGA TTTCCGCCTC GGACGCGGCG TCGGTCGGGG CGCTGGACAT GGTGCAGCTG 
TTCCAGCAAT CGGCCAAGGC CGCTGGAATC GACCTGACCG TCAAGCGCGA GCCGGACGAC 
GGCTATTGGT CGAATGTCTG GCTGAAGAAG CCCTTTTGCG TCAGCTACTG GAACGGCCGC 
CCGACCGAGG ACGACATGTT CAGCCTGGTC TATGCCCGGG GCGCCGAGTG GAACGAAAGC 
CACTGGGACA ACGAGCGATT CAACGAACTG CTGCTGAAGG CGCGGGCCGA GCTGGACGAA 
GGCCTGCGCG CCGAGATGTA TCGCGAGATG CAGGGGCTGG TTTCCGAGGA CGGCGGCACC 
ATCATCCCGA TTTTCGTGAA CTATATCGAC GTGGCCAATG ACAAGGTGGC GCATGGCGAG 
GTGGCGTCGA ACCGCTTCCT CGACGGCTGG AAGATCGTGG AACGGTGGTG GCAGGCATGA

Protein sequence

MSFNPTGQGL TRRGLLAGAA GMAAAGLILP RGARAQEARR GGRLRIGHLG GATSDTLDPA 
TYAAGPVVTA MLAVCNNLVE IDAKGQAVPE LAEFEPDAEA RVWTFRLKDG VTFSDGRKLT 
ARDVIASFDH HRGADTKSGA KGSLEQVKEI RADGDNVVVF ELTSGNADFA YLTSDYHFVI 
MPANEDGTLD WQSGLGTGGY VLENFEPGVR ITLKRRDDYW KPDRAWFDEA VLLTINDATA 
RQNALMTGEV DVINSPDLAT LHLLQRRPGL QLVEVTGTAH YTMPMFCDQA PFTDPNLRLA 
LKYAIDRQEV LDKVLRGHGQ IANDSPIAPA NRFFAADLPQ RAYDPDKAKH YLKQAGMEGL 
KVEISASDAA SVGALDMVQL FQQSAKAAGI DLTVKREPDD GYWSNVWLKK PFCVSYWNGR 
PTEDDMFSLV YARGAEWNES HWDNERFNEL LLKARAELDE GLRAEMYREM QGLVSEDGGT 
IIPIFVNYID VANDKVAHGE VASNRFLDGW KIVERWWQA