Gene EcE24377A_4034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4034
Symbol	dppC
ID	5587283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4016688
End bp	4017590
Gene Length	903 bp
Protein Length	300 aa
Translation table	11
GC content	59%
IMG OID	640927654
Product	dipeptide transporter
Protein accession	YP_001465015
Protein GI	157158176
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1173] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACAGG TTACTGAAAA TAAAGTGATT AGCGCACCGG TGCCGATGAC CCCGTTACAG 
GAGTTCTGGC ACTATTTTAA ACGCAACAAA GGCGCGGTCG TCGGGCTGGT TTACGTCGTC 
ATCGTGCTGT TCATCGCGAT CTTTGCCAAC TGGATTGCAC CCTATAACCC GGCGGAACAG 
TTCCGCGATG CACTGCTCGC CCCGCCAGCC TGGCAGGAAG GCGGCAGCAT GGCGCACTTG 
CTGGGCACCG ATGACGTAGG CCGTGATGTG CTGTCGCGCC TGATGTACGG TGCGCGCCTG 
TCGCTGCTGG TTGGCTGTCT GGTAGTTGTG TTATCGCTGA TTATGGGCGT TATTCTCGGC 
CTGATCGCCG GTTACTTTGG CGGCCTGGTC GATAACATCA TTATGCGCGT GGTCGATATC 
ATGCTGGCGC TGCCAAGTCT GCTGCTGGCG CTGGTGCTGG TGGCAATTTT CGGCCCGTCG 
ATTGGTAACG CCGCGCTGGC GCTGACCTTC GTTGCCTTGC CGCACTATGT GCGCTTAACC 
CGCGCCGCCG TGCTGGTGGA AGTTAACCGC GATTACGTCA CCGCGTCTCG CGTGGCGGGT 
GCCGGGGCGA TGCGTCAGAT GTTTATTAAC ATCTTCCCGA ACTGCCTTGC GCCGCTGATT 
GTTCAGGCGT CGCTCGGTTT CTCTAACGCC ATTCTCGATA TGGCTGCTCT TGGTTTCCTC 
GGCATGGGGG CACAGCCGCC AACGCCTGAG TGGGGCACCA TGCTCTCCGA CGTGTTGCAG 
TTCGCGCAAA GCGCCTGGTG GGTCGTGACC TTCCCGGGTC TGGCGATCCT GCTGACGGTG 
CTGGCATTTA ACCTGATGGG TGACGGTCTG CGTGACGCGC TCGATCCCAA ACTGAAGCAG 
TAA

Protein sequence

MSQVTENKVI SAPVPMTPLQ EFWHYFKRNK GAVVGLVYVV IVLFIAIFAN WIAPYNPAEQ 
FRDALLAPPA WQEGGSMAHL LGTDDVGRDV LSRLMYGARL SLLVGCLVVV LSLIMGVILG 
LIAGYFGGLV DNIIMRVVDI MLALPSLLLA LVLVAIFGPS IGNAALALTF VALPHYVRLT 
RAAVLVEVNR DYVTASRVAG AGAMRQMFIN IFPNCLAPLI VQASLGFSNA ILDMAALGFL 
GMGAQPPTPE WGTMLSDVLQ FAQSAWWVVT FPGLAILLTV LAFNLMGDGL RDALDPKLKQ