Gene SNSL254_A3902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3902
Symbol	dppF
ID	6485058
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3784883
End bp	3785896
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	57%
IMG OID	642739164
Product	dipeptide transporter ATP-binding subunit
Protein accession	YP_002042875
Protein GI	194445624
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACGC ATGAGGCCAC CTTGCAACAG CCGCTGTTGC GGGCTATCGA CCTGAAAAAA 
CACTATCCGG TGAAGAAGGG GATCTTTTCT CCGGAACGGC TGGTAAAAGC GCTGGATGGC 
GTGTCGTTTA ATCTCGAACG CGGTAAAACG CTGGCCGTAG TGGGGGAGTC CGGTTGTGGA 
AAATCCACAC TGGGCCGCCT GCTGACGATG ATTGAAACGC CAACCGGCGG CGAGCTTTAT 
TACCAGGGGC AGGATCTGCT CAAACACGAT CCGCACGCGC AGAAACTGCG GCGGCAGAAA 
ATTCAGATTG TGTTTCAGAA CCCCTACGGT TCCCTGAACC CACGCAAAAA AGTGGGGCAA 
ATTCTGGAAG AGCCGTTGCT GATCAATACC AGCCTGAGTA AAGCGCAGCG TCGTGAAAAA 
GCGCTGGCGA TGATGGCGAA GGTGGGGCTG AAAACCGAGC ACTACGACCG CTATCCGCAT 
ATGTTCTCCG GCGGCCAGCG TCAGCGTATC GCTATCGCCC GCGGTCTGAT GCTTGATCCG 
GACGTAGTGA TTGCCGACGA ACCGGTCTCC GCGCTCGACG TGTCGGTGCG TGCCCAGGTG 
CTGAACCTGA TGATGGATTT GCAACAGGAT ATGGGGCTGT CTTATGTCTT TATCTCGCAC 
GACCTGTCGG TGGTGGAACA CATCGCCGAT GAAGTAATGG TCATGTACTT AGGCCGCTGC 
GTGGAGAAAG GGACCAAAGA GCAGATTTTT AACAATCCAC GTCATCCCTA TACCCAGGCG 
TTGCTCTCCG CCACGCCACG GCTGAATCCG GACGATCGCC GTGAGCGGAT TAAGCTGACC 
GGCGAGTTGC CGAGCCCGCT GAACCCGCCG CCGGGCTGCG CCTTCAACGC CCGCTGCAGC 
CGTCGCTTCG GACCCTGTAC GCAGTTACAG CCGCAGCTTA AAGAGTACGA CGGCCAGTTG 
GTGGCCTGCT TTGCCGTCGA TCAGGATGAA AACCCGCAGA AACCGTTGAG TTAA

Protein sequence

MSTHEATLQQ PLLRAIDLKK HYPVKKGIFS PERLVKALDG VSFNLERGKT LAVVGESGCG 
KSTLGRLLTM IETPTGGELY YQGQDLLKHD PHAQKLRRQK IQIVFQNPYG SLNPRKKVGQ 
ILEEPLLINT SLSKAQRREK ALAMMAKVGL KTEHYDRYPH MFSGGQRQRI AIARGLMLDP 
DVVIADEPVS ALDVSVRAQV LNLMMDLQQD MGLSYVFISH DLSVVEHIAD EVMVMYLGRC 
VEKGTKEQIF NNPRHPYTQA LLSATPRLNP DDRRERIKLT GELPSPLNPP PGCAFNARCS 
RRFGPCTQLQ PQLKEYDGQL VACFAVDQDE NPQKPLS