Gene EcSMS35_3860 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3860
Symbol	dppD
ID	6144962
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3929337
End bp	3930320
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	56%
IMG OID	641618686
Product	dipeptide transporter ATP-binding subunit
Protein accession	YP_001745826
Protein GI	170682826
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTTAT TAAATGTAGA TAAATTATCG GTGCATTTCG GCGACGAAAG CGCACCGTTC 
CGCGCCGTAG ACCGCATCAG CTACAGCGTA AAACAGGGCG AAGTAGTCGG GATTGTGGGT 
GAGTCCGGCT CTGGTAAATC GGTCAGTTCG CTGGCGATTA TGGGGCTGAT TGATTATCCG 
GGCCGCGTAA TGGCGGAAAA GCTGGAGTTT AACGGTCAGG ATTTACAGCG TATCTCAGAA 
AAAGAGCGCC GCAACCTGGT GGGTGCCGAA GTGGCGATGA TCTTCCAGGA CCCGATGACC 
AGCCTTAACC CGTGCTACAC CGTGGGTTTC CAGATTATGG AAGCGATTAA GGTGCATCAG 
GGCGGCAACA AAAGTACCCG CCGTCAGCGG GCGATTGACC TGCTGAATCA GGTCGGTATT 
CCCGATCCGG CATCGCGTCT GGATGTTTAC CCGCATCAGC TTTCCGGCGG CATGAGCCAG 
CGCGTGATGA TCGCCATGGC GATTGCCTGT CGGCCAAAAC TGCTGATTGC CGATGAACCA 
ACCACTGCGC TGGACGTGAC CATTCAGGCG CAAATCATTG AACTACTGCT GGAGCTACAG 
CAGAAAGAGA ACATGGCGCT GGTGTTAATT ACCCATGACC TGGCGCTGGT GGCGGAAGCG 
GCACATAAAA TCATCGTGAT GTATGCAGGT CAGGTGGTGG AAACGGGCGA TGCGCACGCC 
ATCTTCCATG CGCCGCGTCA CCCGTATACT CAGGCATTGC TGCGTGCGCT GCCGGAATTT 
GCTCAGGATA AAGAACGTCT GGCGTCGTTG CCAGGTGTTG TTCCCGGCAA GTATGACCGT 
CCGAACGGCT GCCTGCTTAA CCCGCGCTGT CCCTACGCCA CTGACAAATG CCGCGCTGAA 
GAACCGGCGC TGAATATGCT CGCTGACGGG CGTCAGTCCA AATGCCACTA CCCACTTGAT 
GATGCCGGGA GGCCGACACT ATGA

Protein sequence

MALLNVDKLS VHFGDESAPF RAVDRISYSV KQGEVVGIVG ESGSGKSVSS LAIMGLIDYP 
GRVMAEKLEF NGQDLQRISE KERRNLVGAE VAMIFQDPMT SLNPCYTVGF QIMEAIKVHQ 
GGNKSTRRQR AIDLLNQVGI PDPASRLDVY PHQLSGGMSQ RVMIAMAIAC RPKLLIADEP 
TTALDVTIQA QIIELLLELQ QKENMALVLI THDLALVAEA AHKIIVMYAG QVVETGDAHA 
IFHAPRHPYT QALLRALPEF AQDKERLASL PGVVPGKYDR PNGCLLNPRC PYATDKCRAE 
EPALNMLADG RQSKCHYPLD DAGRPTL