Gene EcSMS35_3862 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3862
Symbol	dppB
ID	6144257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3931243
End bp	3932262
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	56%
IMG OID	641618688
Product	dipeptide transporter permease DppB
Protein accession	YP_001745828
Protein GI	170681195
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCAGT TTATTCTCCG ACGTTTGGGA CTCGTCATCC CCACGTTTAT CGGTATTACC 
CTTCTCACAT TTGCCTTTGT CCACATGATC CCGGGCGATC CGGTGATGAT CATGGCGGGC 
GAGCGTGGGA TCTCCCCAGA GCGTCACGCG CAATTGCTGG CTGAACTCGG CTTAGATAAA 
CCGATGTGGC AGCAGTATCT CCATTACATT TGGGGCGTAA TGCACGGTGA TTTAGGCATT 
TCCATGAAAA GCCGAATTCC GGTATGGGAA GAGTTCGTGC CGCGCTTTCA GGCTACGCTG 
GAACTTGGCG TCTGCGCGAT GATTTTTGCG ACGGCAGTCG GTATTCCGGT TGGTGTGCTG 
GCTGCGGTTA AACGTGGTTC CATTTTCGAT CACACAGCGG TTGGCCTGGC GCTGACCGGC 
TACTCGATGC CAATTTTCTG GTGGGGCATG ATGCTGATCA TGCTGGTTTC GGTGCACTGG 
AACCTGACGC CTGTCTCCGG TCGTGTGAGC GACATGGTGT TCCTCGATGA TTCCAATCCG 
TTAACCGGTT TTATGCTGAT CGACACCGCC ATCTGGGGTG AAGACGGTAA CTTTATCGAT 
GCCGTCGCCC ATATGATCCT ACCCGCCATT GTGCTGGGTA CCATCCCGCT GGCGGTCATT 
GTGCGTATGA CGCGCTCCTC GATGCTGGAA GTGCTGGGCG AAGATTATAT CCGCACCGCG 
CGTGCCAAAG GTCTTACCCG GATGCGGGTG ATTATCGTCC ATGCGCTGCG TAACGCGATG 
CTGCCGGTGG TGACCGTTAT CGGCCTGCAG GTGGGAACAT TGCTGGCGGG GGCGATTCTG 
ACTGAAACCA TCTTCTCGTG GCCCGGTCTG GGGCGTTGGT TGATTGACGC ACTGCAACGC 
CGCGATTATC CGGTAGTGCA GGGCGGCGTA TTGCTGGTGG CGACGATGAT TATCCTCGTC 
AACCTGCTGG TCGATTTGCT GTACGGCGTG GTGAACCCGC GTATTCGTCA TAAGAAGTAA

Protein sequence

MLQFILRRLG LVIPTFIGIT LLTFAFVHMI PGDPVMIMAG ERGISPERHA QLLAELGLDK 
PMWQQYLHYI WGVMHGDLGI SMKSRIPVWE EFVPRFQATL ELGVCAMIFA TAVGIPVGVL 
AAVKRGSIFD HTAVGLALTG YSMPIFWWGM MLIMLVSVHW NLTPVSGRVS DMVFLDDSNP 
LTGFMLIDTA IWGEDGNFID AVAHMILPAI VLGTIPLAVI VRMTRSSMLE VLGEDYIRTA 
RAKGLTRMRV IIVHALRNAM LPVVTVIGLQ VGTLLAGAIL TETIFSWPGL GRWLIDALQR 
RDYPVVQGGV LLVATMIILV NLLVDLLYGV VNPRIRHKK