Gene EcSMS35_3861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3861
Symbol	dppC
ID	6147037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3930331
End bp	3931233
Gene Length	903 bp
Protein Length	300 aa
Translation table	11
GC content	59%
IMG OID	641618687
Product	dipeptide transporter
Protein accession	YP_001745827
Protein GI	170680093
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1173] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACAGG TTACTGAAAA TAAAGTGATT AGCGCACCGG TGCCGATGAC CCCGTTACAG 
GAGTTCTGGC ACTATTTTAA ACGCAACAAA GGCGCGGTTG TCGGGCTGGT TTACGTCGTC 
ATCGTGCTGT TTATCGCGAT CTTTGCCAAC TGGATTGCAC CCTATAACCC GGCGGAACAG 
TTCCGCGATG CACTGCTCGC CCCGCCAGCC TGGCAGGAAG GCGGCAGCAT GGCGCACTTG 
CTGGGCACTG ATGACGTGGG GCGTGATGTG CTGTCGCGGC TGATGTACGG CGCGCGCTTG 
TCGCTGCTGG TTGGCTGTCT GGTAGTGGTG TTATCGCTGA TTATGGGCGT TATTCTCGGC 
CTGATCGCTG GTTACTTTGG CGGTCTGGTC GATAACATCA TCATGCGCGT GGTCGATATC 
ATGCTGGCGC TGCCAAGTCT ACTGCTGGCA CTGGTGCTGG TGGCGATTTT CGGCCCGTCG 
ATTGGTAACG CCGCGCTGGC GCTAACCTTC GTTGCGCTGC CGCATTATGT GCGCTTAACC 
CGCGCCGCCG TGCTGGTGGA AGTTAACCGC GATTACGTCA CCGCGTCTCG CGTGGCGGGT 
GCCGGGGCAA TGCGCCAGAT GTTTATTAAC ATCTTCCCGA ACTGCCTTGC GCCGCTGATT 
GTTCAGGCGT CGCTCGGTTT CTCTAACGCT ATTCTCGATA TGGCCGCCCT TGGCTTCCTC 
GGCATGGGGG CGCAGCCGCC AACGCCGGAG TGGGGCACCA TGCTCTCTGA CGTGTTGCAG 
TTCGCGCAAA GCGCCTGGTG GGTCGTGACC TTCCCGGGTC TGGCGATCCT GCTGACGGTG 
CTGGCATTTA ACCTGATGGG TGACGGTCTG CGTGACGCGC TCGATCCCAA ACTGAAGCAG 
TAA

Protein sequence

MSQVTENKVI SAPVPMTPLQ EFWHYFKRNK GAVVGLVYVV IVLFIAIFAN WIAPYNPAEQ 
FRDALLAPPA WQEGGSMAHL LGTDDVGRDV LSRLMYGARL SLLVGCLVVV LSLIMGVILG 
LIAGYFGGLV DNIIMRVVDI MLALPSLLLA LVLVAIFGPS IGNAALALTF VALPHYVRLT 
RAAVLVEVNR DYVTASRVAG AGAMRQMFIN IFPNCLAPLI VQASLGFSNA ILDMAALGFL 
GMGAQPPTPE WGTMLSDVLQ FAQSAWWVVT FPGLAILLTV LAFNLMGDGL RDALDPKLKQ