Gene SeD_A4007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4007
Symbol	dppD
ID	6873320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3851115
End bp	3852098
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	56%
IMG OID	642786961
Product	dipeptide transporter ATP-binding subunit
Protein accession	YP_002217589
Protein GI	198246011
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTTAT TAAATGTAGA TCAATTATCG GTGCACTTCG GCGACGAAGG GACACCGTTC 
AAAGCCGTCG ACCGCATTAG CTACAGCGTG AAGCAGGGTG AGGTGGTCGG GATTGTCGGC 
GAGTCTGGTT CCGGCAAATC CGTCAGCTCG CTGGCGATTA TGGGGCTTAT CGATTACCCA 
GGCCGCGTGA TGGCGGAAAA CCTGCTCTTT AACGGACAGG ATCTGAAGCG CATTTCCGAG 
AAGGAACGTC GCAACCTGGT GGGTGCTGAA GTGGCGATGA TTTTCCAGGA CCCGATGACC 
AGCCTCAATC CTTGCTATAC CGTTGGCTTT CAGATTATGG AAGCCATCAA GGTACATCAG 
GGCGGGAACA AGAAAACCCG TCGTCAGCGA GCGATTGACC TGTTGAACCA GGTGGGTATT 
CCCGATCCGG CTTCTCGTCT GGATGTCTAT CCGCACCAGC TTTCTGGCGG CATGAGTCAG 
CGCGTGATGA TTGCGATGGC CATAGCCTGT CGACCAAAGC TGTTAATTGC TGATGAACCG 
ACCACGGCGC TGGATGTGAC CATTCAGGCG CAAATCATTG AGCTGCTGCT GGAGTTGCAG 
CAAAAAGAGA ACATGGCGCT GGTGCTGATT ACCCATGACC TGGCGCTGGT GGCGGAAGCG 
GCGCACAAAA TTATCGTCAT GTACGCCGGG CAGGTCGTCG AAACCGGCGC TGCGCAGGAT 
ATTTTCCGCG CGCCGCGTCA TCCGTATACC CAGGCATTGC TACGTGCGTT ACCAGAGTTT 
GCGCAAGATA AAGCGCGTCT GGCGTCGCTG CCGGGCGTGG TGCCGGGGAA ATATGACCGA 
CCGACGGGTT GTCTGCTTAA CCCTCGCTGC CCCTACGCCA CGGACAGATG TCGTGCGGAA 
GAACCTGCTC TCAACCAACT GGACGATGGA CGTCAGTCAA AATGTCATTA CCCACTCGAT 
GATGCCGGGA GGCCCACACT ATGA

Protein sequence

MALLNVDQLS VHFGDEGTPF KAVDRISYSV KQGEVVGIVG ESGSGKSVSS LAIMGLIDYP 
GRVMAENLLF NGQDLKRISE KERRNLVGAE VAMIFQDPMT SLNPCYTVGF QIMEAIKVHQ 
GGNKKTRRQR AIDLLNQVGI PDPASRLDVY PHQLSGGMSQ RVMIAMAIAC RPKLLIADEP 
TTALDVTIQA QIIELLLELQ QKENMALVLI THDLALVAEA AHKIIVMYAG QVVETGAAQD 
IFRAPRHPYT QALLRALPEF AQDKARLASL PGVVPGKYDR PTGCLLNPRC PYATDRCRAE 
EPALNQLDDG RQSKCHYPLD DAGRPTL