Gene YpsIP31758_4071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_4071
Symbol	dppF
ID	5386185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	4587484
End bp	4588560
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	50%
IMG OID	640867099
Product	dipeptide transporter ATP-binding subunit
Protein accession	YP_001403015
Protein GI	153949844
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTCGA ACACTGAAGC GGCGCATAAA GTAAACATGA TGGGTGAAAC CGAAATAAAG 
GGAGAAAGTT TGCCAGCAGA GACGGGTAAA AAGCCGTTAT TACAGGCGAT CGATCTGAAA 
AAATACTACC CGGTGAAAAA GGGTTTCTTT ACACCAGAAC GTTTGGTTAA AGCACTGGAT 
GGCGTTTCGT TCACATTGGA GCGGGGCAAA ACATTGGCGG TAGTGGGTGA ATCAGGTTGT 
GGTAAATCCA CTCTGGGCCG CTTACTGACG ATGATAGAGA TCCCTACCGG CGGCGAACTA 
TACTATCAAG GGCAGGATCT GCTCAAGCCC GATGAAAGTG CGGAAAAACT GCGACGCCAG 
AAGATTCAGA TTGTCTTCCA GAACCCCTAC GGTTCGCTGA ATCCACGTAA GAAGGTGGGG 
CAGATTTTGG AAGAGCCATT GCAGATCAAT ACCCAGCTCA ATCGCAAGGA GCGCCGCGAA 
AAAACCTTGG CAATGATGGC GAAAGTGGGC CTGAAAACTG AACATTATGA TCGCTATCCT 
CATATGTTTT CCGGTGGTCA GCGTCAACGG ATCGCCATTG CCCGTGGATT GATGTTAAAC 
CCTGATGTGG TGATTGCCGA TGAGCCGGTA TCTGCGCTGG ATGTCTCCGT GCGGGCGCAG 
GTACTGAACC TGATGATGGA TTTACAGCAG GAATTGGGGC TGTCATATGT GTTTATTTCC 
CATGACCTGT CGGTGGTTGA ACATATTGCT GACGACGTGA TGGTGATGTA TTTGGGGCGC 
TGCGTTGAAA AAGGCAGCAA AGAGGCTATT TTTAACAACC CCCGCCATCC TTATACGCAA 
GCATTGCTAT CAGCGACACC GCGTCTGAAC CCAGATATGC GTCGTGAGCG TATTAAATTG 
ACTGGAGAAC TACCCAGCCC AATGAATCCA CCGCCAGGTT GTGCATTCAA TGCCCGCTGT 
CGTAGAGCAT TTGGCACCTG TAGCCAGTTG CAGCCGCAGC TTAAGCAGTA TGGTGACCAG 
ATGGTGGCGT GTTTTGCCGT TGATCAGGAT GAAGCAGAGA AGGCCGTTTC TGTTTGA

Protein sequence

MNSNTEAAHK VNMMGETEIK GESLPAETGK KPLLQAIDLK KYYPVKKGFF TPERLVKALD 
GVSFTLERGK TLAVVGESGC GKSTLGRLLT MIEIPTGGEL YYQGQDLLKP DESAEKLRRQ 
KIQIVFQNPY GSLNPRKKVG QILEEPLQIN TQLNRKERRE KTLAMMAKVG LKTEHYDRYP 
HMFSGGQRQR IAIARGLMLN PDVVIADEPV SALDVSVRAQ VLNLMMDLQQ ELGLSYVFIS 
HDLSVVEHIA DDVMVMYLGR CVEKGSKEAI FNNPRHPYTQ ALLSATPRLN PDMRRERIKL 
TGELPSPMNP PPGCAFNARC RRAFGTCSQL QPQLKQYGDQ MVACFAVDQD EAEKAVSV