Gene ECH74115_4909 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4909
Symbol	dppD
ID	6970254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4548116
End bp	4549099
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	56%
IMG OID	643388595
Product	dipeptide transporter ATP-binding subunit
Protein accession	YP_002273023
Protein GI	209398420
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTTAT TAAATGTAGA TAAATTATCG GTGCATTTCG GCGACGAAAG CGCACCGTTC 
CGCGCCGTAG ACCGCATTAG CTACAGCGTA AAACAGGGCG AAGTAGTCGG GATTGTGGGT 
GAGTCTGGCT CCGGTAAGTC GGTCAGTTCG CTGGCGATTA TGGGGCTGAT TGATTATCCG 
GGCCGCGTGA TGGCGGAAAA GCTGGAGTTT AACGGTCAGG ATTTGCAGCG TATCTCGGAA 
AAAGAGCGCC GCAACCTGGT GGGTGCCGAA GTGGCGATGA TCTTCCAGGA CCCGATGACC 
AGCCTTAACC CGTGCTACAC CGTGGGTTTC CAGATTATGG AAGCGATTAA GGTGCATCAG 
GGCGGTAATA AGAGCACTCG TCGTCAGCGG GCGATTGACT TGTTGAATCA GGTCGGTATT 
CCCGATCCGG CTTCGCGTCT GGATGTTTAC CCGCATCAGC TTTCCGGCGG CATGAGCCAG 
CGCGTGATGA TTGCGATGGC CATTGCCTGT CGGCCAAAAC TGCTGATTGC CGATGAACCA 
ACCACTGCGC TGGACGTGAC CATTCAGGCG CAAATCATTG AACTACTGCT GGAGCTACAG 
CAGAAAGAGA ACATGGCGCT GGTGTTAATT ACCCATGACC TGGCGCTGGT GGCGGAAGCG 
GCACATAAAA TCATCGTGAT GTATGCCGGT CAGGTGGTGG AAACGGGCGA TGCGCACGCC 
ATCTTCCATG CGCCGCGTCA CCCGTATACT CAGGCATTGC TGCGTGCGCT GCCGGAATTT 
GCTCAGGACA AAGAACGTCT GGCATCGTTG CCTGGCGTTG TTCCCGGCAA GTACGACCGC 
CCGAACGGCT GCTTGCTTAA CCCGCGCTGC CCCTATGCCA CTGACAGATG TCGCGCTGAA 
GAACCGGCGC TGAATATGCT CGCTGACGGG CGTCAGTCCA AATGCCATTA CCCACTTGAT 
GATGCCGGGA GGCCGACACT ATGA

Protein sequence

MALLNVDKLS VHFGDESAPF RAVDRISYSV KQGEVVGIVG ESGSGKSVSS LAIMGLIDYP 
GRVMAEKLEF NGQDLQRISE KERRNLVGAE VAMIFQDPMT SLNPCYTVGF QIMEAIKVHQ 
GGNKSTRRQR AIDLLNQVGI PDPASRLDVY PHQLSGGMSQ RVMIAMAIAC RPKLLIADEP 
TTALDVTIQA QIIELLLELQ QKENMALVLI THDLALVAEA AHKIIVMYAG QVVETGDAHA 
IFHAPRHPYT QALLRALPEF AQDKERLASL PGVVPGKYDR PNGCLLNPRC PYATDRCRAE 
EPALNMLADG RQSKCHYPLD DAGRPTL