Gene EcSMS35_1893 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1893
Symbol	oppF
ID	6143224
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1913711
End bp	1914715
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	52%
IMG OID	641616769
Product	oligopeptide ABC transporter, ATP-binding protein OppF
Protein accession	YP_001743947
Protein GI	170680026
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.854707
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.049175
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCTG TAACCGAAGG AAGAAAAGTC CTCCTCGAAA TCGCCGATCT GAAAGTGCAC 
TTTGAAATCA AAGATGGCAA ACAGTGGTTC TGGCAACCGC CGAAAACGCT CAAAGCCGTC 
GATGGTGTAA CTCTTCGCCT GTATGAAGGG GAAACATTAG GTGTGGTAGG GGAATCGGGA 
TGCGGTAAGT CCACCTTTGC TCGCGCCATC ATCGGTTTGG TCAAGGCGAC CGACGGTCAT 
GTTGCCTGGT TAGGTAAAGA GTTGCTGGGC ATGAAGCCCG ATGAATGGCG TGCCGTTCGC 
AGTGATATTC AGATGATTTT CCAGGATCCG TTGGCATCGC TGAACCCGCG TATGACCATC 
GGCGAGATCA TCGCTGAACC ACTGCGTACT TATCATCCGA AAATGTCACG CCAGGAAGTT 
CGCGAGCGCG TGAAGGCGAT GATGCTGAAA GTCGGGTTAT TGCCTAACCT GATTAACCGC 
TATCCGCATG AGTTCTCTGG TGGGCAGTGC CAGCGTATCG GGATTGCACG TGCACTTATT 
CTTGAACCGA AGCTGATTAT CTGTGATGAG CCGGTGTCGG CGCTGGATGT GTCAATTCAG 
GCGCAGGTGG TCAACCTGCT CCAGCAGTTA CAACGTGAGA TGGGATTGTC ATTAATTTTT 
ATCGCTCACG ACCTGGCCGT GGTAAAACAC ATTTCCGATC GTGTGTTGGT GATGTATCTC 
GGCCATGCGG TAGAACTGGG GACCTATGAT GAGGTCTACC ACAATCCACT ACATCCTTAC 
ACCAGGGCAT TGATGTCGGC AGTCCCCATA CCTGATCCGG ATCTGGAGAA GAACAAAACC 
ATCCAGTTAC TGGAAGGGGA ATTACCGTCG CCGATCAACC CGCCTTCCGG TTGTGTTTTC 
CGTACCCGTT GCCCGATTGC CGGTCCGGAG TGCGCCAAAA CACGTCCTGT GCTGGAGGGC 
AGTTTCAGAC ACGCCGTTTC TTGCCTGAAA GTCGATCCAC TTTAA

Protein sequence

MNAVTEGRKV LLEIADLKVH FEIKDGKQWF WQPPKTLKAV DGVTLRLYEG ETLGVVGESG 
CGKSTFARAI IGLVKATDGH VAWLGKELLG MKPDEWRAVR SDIQMIFQDP LASLNPRMTI 
GEIIAEPLRT YHPKMSRQEV RERVKAMMLK VGLLPNLINR YPHEFSGGQC QRIGIARALI 
LEPKLIICDE PVSALDVSIQ AQVVNLLQQL QREMGLSLIF IAHDLAVVKH ISDRVLVMYL 
GHAVELGTYD EVYHNPLHPY TRALMSAVPI PDPDLEKNKT IQLLEGELPS PINPPSGCVF 
RTRCPIAGPE CAKTRPVLEG SFRHAVSCLK VDPL