Gene EcSMS35_1894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1894
Symbol	oppD
ID	6144189
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1914712
End bp	1915725
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	52%
IMG OID	641616770
Product	oligopeptide transporter ATP-binding component
Protein accession	YP_001743948
Protein GI	170684293
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.702324
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0894334
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTAA TTGAAACTGC AACTGTGCCG CTCGCACAAC AACAGGCTGA CGCACTGCTG 
AACGTGAAAG ATTTGCGTGT CACCTTTAAT ACCCCGGACG GCGACGTCAC GGCGGTCAAT 
GATCTGAATT TTTCCCTACG TGCCGGAGAA ACGCTGGGCA TTGTAGGTGA GTCTGGTTCG 
GGTAAATCGC AAACTGCATT TGCGTTGATG GGCCTGTTGG CTGCCAACGG ACGTATTGGC 
GGATCGGCAA CCTTCAATGG GCGTGAAATC CTCAATTTGC CAGAGCGTGA ACTCAATAAA 
CTGCGCGCTG AACAAATCTC AATGATTTTT CAGGACCCAA TGACTTCGTT GAATCCCTAT 
ATGCGCGTCG GTGAGCAGTT GATGGAAGTG CTGATGCTGC ATAAGAACAT GAGCAAAGCT 
GAGGCGTTTG AAGAGTCGGT GCGGATGCTC GATGCGGTAA AAATGCCGGA AGCGCGTAAA 
CGCATGAAAA TGTACCCGCA CGAATTTTCT GGCGGCATGC GTCAGCGAGT TATGATTGCG 
ATGGCATTGC TATGTCGACC TAAGCTGCTG ATTGCGGATG AACCCACTAC TGCGCTGGAC 
GTCACCGTAC AGGCGCAGAT CATGACGCTA TTGAATGAAC TGAAGCGGGA ATTTAATACC 
GCCATCATTA TGATTACCCA CGATCTTGGC GTGGTGGCGG GGATCTGCGA CAAAGTGCTG 
GTAATGTACG CCGGGCGCAC GATGGAATAT GGCAACGCGC GCGATGTCTT TTATCAACCC 
GTTCATCCTT ATTCTATCGG TTTGCTCAAC GCGGTGCCGC GTCTCGATGC GGAAGGTGAA 
ACAATGTTGA CCATCCCTGG TAATCCGCCA AACCTGCTGC GATTACCGAA AGGTTGCCCG 
TTCCAGCCAC GTTGTCCGCA TGCGATGGAA ATTTGTAGTA GCGCACCGCC GCTGGAAGAG 
TTTACGCCTG GCCGTCTGCG TGCTTGCTTT AAACCGGTGG AGGAACTGTT ATGA

Protein sequence

MSVIETATVP LAQQQADALL NVKDLRVTFN TPDGDVTAVN DLNFSLRAGE TLGIVGESGS 
GKSQTAFALM GLLAANGRIG GSATFNGREI LNLPERELNK LRAEQISMIF QDPMTSLNPY 
MRVGEQLMEV LMLHKNMSKA EAFEESVRML DAVKMPEARK RMKMYPHEFS GGMRQRVMIA 
MALLCRPKLL IADEPTTALD VTVQAQIMTL LNELKREFNT AIIMITHDLG VVAGICDKVL 
VMYAGRTMEY GNARDVFYQP VHPYSIGLLN AVPRLDAEGE TMLTIPGNPP NLLRLPKGCP 
FQPRCPHAME ICSSAPPLEE FTPGRLRACF KPVEELL