Gene SeD_A4006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4006
Symbol	dppF
ID	6871063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3850105
End bp	3851118
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	57%
IMG OID	642786960
Product	dipeptide transporter ATP-binding subunit
Protein accession	YP_002217588
Protein GI	198243967
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	73
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACGC ATGAGGCCAC CTTGCAACAG CCGCTGTTGC GGGCTATCGA CCTGAAAAAA 
CACTATCCGG TGAAGAAGGG GATCTTTTCT CCGGAACGGC TGGTAAAAGC GCTGGATGGC 
GTGTCGTTTA ATCTCGAACG CGGTAAAACG CTGGCGGTAG TGGGGGAGTC CGGTTGTGGA 
AAATCCACAC TGGGCCGCCT GCTGACGATG ATTGAAACGC CAACCGGCGG CGAGCTTTAT 
TACCAGGGGC AGGATCTGCT CAAACACGAT CCGCACGCGC AGAAACTGCG GCGGCAGAAA 
ATTCAGATTG TGTTTCAGAA CCCCTACGGT TCCCTGAACC CACGCAAGAA AGTGGGGCAA 
ATTCTGGAAG AGCCGTTGCT GATCAATACC AGCCTGAGTA AAGCGCAGCG TCGTGAAAAA 
GCGCTGGCGA TGATGGCGAA GGTGGGGCTG AAAACCGAGC ACTACGACCG CTATCCGCAT 
ATGTTCTCCG GCGGCCAGCG TCAGCGTATC GCTATCGCCC GCGGTCTGAT GCTTGATCCG 
GACGTAGTGA TTGCCGACGA ACCGGTCTCC GCGCTCGACG TGTCGGTGCG CGCCCAGGTG 
CTGAACCTGA TGATGGATTT GCAACAGGAT ATGGGGCTGT CTTATGTCTT TATCTCGCAC 
GACCTGTCGG TGGTGGAACA CATCGCCGAT GAAGTGATGG TCATGTACTT AGGCCGCTGC 
GTGGAGAAAG GGACCAAAGA GCAGATTTTT AACAATCCAC GTCATCCCTA TACCCAGGCG 
TTGCTCTCCG CCACGCCGCG GCTGAATCCG GACGATCGCC GTGAGCGGAT TAAGCTGACC 
GGCGAGTTGC CGAGTCCGCT GAACCCGCCG CCGGGCTGCG CCTTCAACGC CCGCTGCAGC 
CGTCGCTTCG GACCCTGTAC GCAGTTACAG CCGCAGCTTA AAGAGTACGA CGGCCAGTTG 
GTGGCCTGCT TTGCCGTCGA TCAGGATGAA AACCCGCAGA AACCGTTGAG TTAA

Protein sequence

MSTHEATLQQ PLLRAIDLKK HYPVKKGIFS PERLVKALDG VSFNLERGKT LAVVGESGCG 
KSTLGRLLTM IETPTGGELY YQGQDLLKHD PHAQKLRRQK IQIVFQNPYG SLNPRKKVGQ 
ILEEPLLINT SLSKAQRREK ALAMMAKVGL KTEHYDRYPH MFSGGQRQRI AIARGLMLDP 
DVVIADEPVS ALDVSVRAQV LNLMMDLQQD MGLSYVFISH DLSVVEHIAD EVMVMYLGRC 
VEKGTKEQIF NNPRHPYTQA LLSATPRLNP DDRRERIKLT GELPSPLNPP PGCAFNARCS 
RRFGPCTQLQ PQLKEYDGQL VACFAVDQDE NPQKPLS