Gene EcHS_A3744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3744
Symbol	dppA
ID	5593889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3735569
End bp	3737176
Gene Length	1608 bp
Protein Length	535 aa
Translation table	11
GC content	52%
IMG OID	640922858
Product	dipeptide ABC transporter, periplasmic dipeptide-binding protein
Protein accession	YP_001460337
Protein GI	157163019
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTATTT CCTTGAAAAA GTCAGGGATG CTGAAGCTTG GTCTCAGCCT GGTGGCTATG 
ACCGTCGCAG CAAGTGTTCA GGCTAAAACT CTGGTTTATT GCTCAGAAGG ATCTCCGGAA 
GGGTTTAACC CGCAGCTGTT TACCTCCGGC ACCACCTATG ACGCCTCTTC CGTCCCGCTT 
TATAACCGTC TGGTTGAATT TAAAATCGGC ACCACCGAAG TGATCCCGGG CCTCGCTGAA 
AAGTGGGAAG TCAGCGAAGA CGGTAAAACC TATACCTTCC ATCTGCGTAA AGGTGTGAAG 
TGGCACGACA ATAAAGAATT CAAACCGACG CGTGAACTGA ACGCCGATGA TGTGGTGTTC 
TCGTTCGATC GTCAGAAAAA CGCGCAAAAC CCGTACCATA AAGTTTCTGG CGGCAGCTAC 
GAATACTTCG AAGGCATGGG CTTGCCAGAG CTGATCAGTG AAGTGAAAAA GGTGGACGAC 
AACACCGTTC AGTTTGTGCT GACTCGCCCG GAAGCGCCGT TCCTCGCTGA CCTGGCAATG 
GACTTCGCCT CTATTCTGTC AAAAGAATAT GCTGATGCGA TGATGAAAGC CGGTACACCG 
GAAAAACTGG ACCTCAACCC AATCGGAACC GGTCCGTTCC AGTTACAGCA GTATCAAAAA 
GATTCCCGTA TCCGCTACAA AGCGTTTGAT GGCTACTGGG GCACCAAACC GCAGATCGAT 
ACGCTGGTTT TCTCTATTAC CCCTGACGCT TCCGTGCGTT ACGCGAAATT GCAGAAGAAT 
GAATGCCAGG TGATGCCGTA CCCGAACCCG GCAGATATCG CTCGCATGAA GCAGGATAAA 
TCCATCAATC TGATGGAAAT GCCGGGGCTG AACGTCGGTT ATCTCTCGTA TAACGTGCAG 
AAAAAACCAC TCGATGACGT GAAAGTTCGC CAGGCTCTGA CCTACGCGGT GAACAAAGAC 
GCGATCATCA AAGCGGTTTA TCAGGGCGCG GGCGTATCAG CGAAAAACCT GATCCCGCCA 
ACCATGTGGG GCTATAACGA CGACGTTCAG GACTACACCT ACGATCCTGA AAAAGCGAAA 
GCCTTGCTGA AAGAAGCGGG TCTGGAAAAA GGTTTCTCCA TCGACCTGTG GGCGATGCCG 
GTACAACGTC CGTATAACCC GAACGCTCGC CGCATGGCGG AGATGATTCA GGCAGACTGG 
GCGAAAGTCG GCGTGCAGGC CAAAATTGTC ACCTACGAAT GGGGTGAGTA CCTCAAGCGT 
GCGAAAGATG GCGAGCACCA GACGGTAATG ATGGGCTGGA CTGGCGATAA CGGGGATCCG 
GATAACTTCT TCGCCACCCT GTTCAGCTGC GCCGCCTCTG AACAAGGCTC CAACTACTCA 
AAATGGTGCT ACAAACCGTT TGAAGATCTG ATTCAACCGG CGCGTGCTAC CGACGACCAC 
AATAAACGCG TTGAACTGTA CAAACAAGCG CAGGTGGTGA TGCACGATCA GGCTCCGGCA 
CTGATCATCG CTCACTCCAC CGTGTTTGAA CCGGTACGTA AAGAAGTTAA AGGCTATGTG 
GTTGATCCAT TAGGCAAACA TCACTTCGAA AACGTCTCTA TCGAATAA

Protein sequence

MRISLKKSGM LKLGLSLVAM TVAASVQAKT LVYCSEGSPE GFNPQLFTSG TTYDASSVPL 
YNRLVEFKIG TTEVIPGLAE KWEVSEDGKT YTFHLRKGVK WHDNKEFKPT RELNADDVVF 
SFDRQKNAQN PYHKVSGGSY EYFEGMGLPE LISEVKKVDD NTVQFVLTRP EAPFLADLAM 
DFASILSKEY ADAMMKAGTP EKLDLNPIGT GPFQLQQYQK DSRIRYKAFD GYWGTKPQID 
TLVFSITPDA SVRYAKLQKN ECQVMPYPNP ADIARMKQDK SINLMEMPGL NVGYLSYNVQ 
KKPLDDVKVR QALTYAVNKD AIIKAVYQGA GVSAKNLIPP TMWGYNDDVQ DYTYDPEKAK 
ALLKEAGLEK GFSIDLWAMP VQRPYNPNAR RMAEMIQADW AKVGVQAKIV TYEWGEYLKR 
AKDGEHQTVM MGWTGDNGDP DNFFATLFSC AASEQGSNYS KWCYKPFEDL IQPARATDDH 
NKRVELYKQA QVVMHDQAPA LIIAHSTVFE PVRKEVKGYV VDPLGKHHFE NVSIE