Gene SeD_A4009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4009
Symbol	dppB
ID	6875034
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3853021
End bp	3854040
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	57%
IMG OID	642786963
Product	dipeptide transporter permease DppB
Protein accession	YP_002217591
Protein GI	198244490
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCAGT TCATTCTCCG ACGTTTGGGA CTCGTTATCC CGACGTTTAT CGGTATTACC 
CTTCTCACCT TTGCCTTTGT CCACATGATC CCCGGCGATC CGGTGATGAT CATGGCGGGT 
GAGCGAGGTA TTTCCCCTGA GCGTCATGCT CAACTGCTGG CTGAACTCGG TCTTGATAAA 
CCGATGTGGC AGCAGTACCT CCATTATATC TGGGGGGTGA TGCATGGCGA TTTAGGCATC 
TCGCTGAAAA GCCGAATCCC CGTGTGGGAC GAGTTCGTGC CTCGCTTTAA AGCGACGCTG 
GAGCTTGGCG TCTGCGCCAT GATTTTTGCC GTCGCCGTGG GGATTCCGGT GGGCGTGCTG 
GCCGCAGTGA AGCGCGGTTC TATCTTCGAT CACACTGCCG TTGGCCTGGC GCTGACCGGT 
TACTCTATGC CTATCTTCTG GTGGGGCATG ATGCTGATCA TGCTGGTTTC CGTCCACTGG 
AACCTGACGC CGGTTTCCGG GCGCGTGAGC GATATGGTGT TCCTTGATGA TACCAATCCG 
TTGACGGGCT TTATGCTGAT CGACACCGCT ATCTGGGGCG AAGAGGGTAA CTTTATTGAT 
GCGCTGGCGC ATATGATCCT GCCTGCGATG GTGCTCGGCA CAATCCCGCT GGCCGTCATT 
GTGCGTATGA CCCGTTCGTC GATGCTGGAA GTGCTGGGGG AGGATTACAT CCGTACCGCA 
CGCGCCAAAG GGTTGACCAG GATGCGCGTC ATTATCGTCC ATGCTCTGCG TAACGCTATG 
CTGCCAGTCG TCACCGTGAT CGGCCTGCAG GTCGGGACGC TGTTGGCGGG CGCGATTCTG 
ACAGAAACTA TCTTCTCGTG GCCCGGTCTG GGGCGCTGGC TGATCGATGC GCTGCAACGC 
CGCGATTATC CGGTAGTGCA GGGCGGCGTG TTACTGGTAG CGACGATGAT TATTCTCGTC 
AACCTGCTGG TAGACCTGCT GTACGGCGTG GTGAACCCGC GTATTCGGCA TAAGAAGTAA

Protein sequence

MLQFILRRLG LVIPTFIGIT LLTFAFVHMI PGDPVMIMAG ERGISPERHA QLLAELGLDK 
PMWQQYLHYI WGVMHGDLGI SLKSRIPVWD EFVPRFKATL ELGVCAMIFA VAVGIPVGVL 
AAVKRGSIFD HTAVGLALTG YSMPIFWWGM MLIMLVSVHW NLTPVSGRVS DMVFLDDTNP 
LTGFMLIDTA IWGEEGNFID ALAHMILPAM VLGTIPLAVI VRMTRSSMLE VLGEDYIRTA 
RAKGLTRMRV IIVHALRNAM LPVVTVIGLQ VGTLLAGAIL TETIFSWPGL GRWLIDALQR 
RDYPVVQGGV LLVATMIILV NLLVDLLYGV VNPRIRHKK