Gene EcE24377A_4037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4037
Symbol	dppA
ID	5586739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4018927
End bp	4020534
Gene Length	1608 bp
Protein Length	535 aa
Translation table	11
GC content	52%
IMG OID	640927657
Product	dipeptide ABC transporter, periplasmic dipeptide-binding protein
Protein accession	YP_001465018
Protein GI	157159059
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTATTT CCTTGAAAAA GTCAGGGATG CTGAAGCTTG GTCTCAGCCT GGTGGCTATG 
ACCGTCGCAG CAAGTGTTCA GGCTAAAACT CTGGTTTATT GCTCAGAAGG ATCTCCGGAA 
GGGTTTAACC CGCAGCTGTT TACCTCCGGC ACCACCTATG ACGCCTCTTC CGTACCGCTT 
TATAACCGCC TGGTTGAATT TAAAATCGGC ACCACTGAAG TGATCCCGGG CCTCGCTGAA 
AAGTGGGAAG TCAGCGAAGA CGGTAAAACC TATACCTTCC ATCTGCGTAA AGGTGTGAAG 
TGGCATGACA ATAAAGAATT CAAACCGACG CGCGAACTGA ACGCCGATGA CGTGGTGTTC 
TCGTTCGATC GTCAGAAAAA CGCGCAAAAC CCGTACCATA AAGTTTCTGG CGGTAGCTAC 
GAATACTTCG AAGGCATGGG CTTGCCGGAG CTGATCAGCG AAGTGAAAAA GGTGGACGAC 
AACACAGTTC AGTTCGTGCT GACTCGCCCG GAAGCGCCGT TCCTCGCTGA TCTGGCAATG 
GACTTCGCCT CTATTCTGTC AAAAGAATAT GCTGATGCGA TGATGAAAGC CGGTACACCG 
GAAAAACTGG ACCTCAACCC AATCGGAACC GGTCCATTCC AGTTACAGCA GTACCAAAAA 
GATTCCCGTA TCCGCTACAA AGCGTTTGAT GGCTACTGGG GCACCAAACC GCAGATCGAT 
ACGCTGGTCT TCTCTATTAC CCCTGATGCT TCCGTGCGTT ACGCGAAATT GCAGAAGAAT 
GAATGCCAGG TGATGCCGTA CCCGAACCCG GCAGATATCG CTCGCATGAA GCAGGATAAA 
TCCATCAACC TGATGGAAAT GCCGGGGCTG AACGTCGGCT ACCTCTCGTA TAACGTGCAG 
AAAAAACCGC TGGATGACGT GAAAGTTCGC CAGGCACTGA CCTACGCGGT GAACAAAGAC 
GCGATCATCA AAGCGGTTTA TCAGGGCGCG GGTGTATCAG CGAAAAACCT GATCCCGCCA 
ACCATGTGGG GCTATAACGA CGACGTTCAG GATTACACCT ACGATCCTGA AAAAGCGAAA 
GCCTTGCTGA AAGAAGCGGG TCTGGAAAAA GGTTTCTCCA TCGACCTGTG GGCGATGCCG 
GTACAACGTC CGTATAACCC GAACGCTCGC CGCATGGCGG AGATGATTCA GGCAGACTGG 
GCGAAAGTGG GCGTGCAGGC CAAAATCGTC ACCTACGAAT GGGGTGAGTA CCTCAAGCGT 
GCGAAAGATG GCGAACATCA GACGGTAATG ATGGGCTGGA CTGGCGATAA CGGGGACCCG 
GATAACTTCT TCGCCACCCT GTTCAGCTGC GCCGCCTCTG AACAAGGTTC TAACTACTCA 
AAATGGTGCT ACAAACCGTT TGAAGATCTG ATTCAACCGG CGCGTGCTAC CGACGACCAT 
AACAAACGCG TTGAACTGTA CAAGCAAGCG CAGGTGGTGA TGCACGATCA GGCTCCGGCA 
CTGATCATCG CTCACTCCAC CGTGTTTGAA CCGGTACGCA AAGAAGTCAA AGGCTATGTG 
GTTGATCCAT TAGGCAAACA TCACTTCGAA AACGTCTCTA TCGAATAA

Protein sequence

MRISLKKSGM LKLGLSLVAM TVAASVQAKT LVYCSEGSPE GFNPQLFTSG TTYDASSVPL 
YNRLVEFKIG TTEVIPGLAE KWEVSEDGKT YTFHLRKGVK WHDNKEFKPT RELNADDVVF 
SFDRQKNAQN PYHKVSGGSY EYFEGMGLPE LISEVKKVDD NTVQFVLTRP EAPFLADLAM 
DFASILSKEY ADAMMKAGTP EKLDLNPIGT GPFQLQQYQK DSRIRYKAFD GYWGTKPQID 
TLVFSITPDA SVRYAKLQKN ECQVMPYPNP ADIARMKQDK SINLMEMPGL NVGYLSYNVQ 
KKPLDDVKVR QALTYAVNKD AIIKAVYQGA GVSAKNLIPP TMWGYNDDVQ DYTYDPEKAK 
ALLKEAGLEK GFSIDLWAMP VQRPYNPNAR RMAEMIQADW AKVGVQAKIV TYEWGEYLKR 
AKDGEHQTVM MGWTGDNGDP DNFFATLFSC AASEQGSNYS KWCYKPFEDL IQPARATDDH 
NKRVELYKQA QVVMHDQAPA LIIAHSTVFE PVRKEVKGYV VDPLGKHHFE NVSIE