Gene B21_01231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01231
Symbol	oppF
ID	8114271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	1290762
End bp	1291766
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	52%
IMG OID	644847482
Product	hypothetical protein
Protein accession	YP_002999055
Protein GI	251784751
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0162122
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGCTG TAACTGAAGG AAGAAAAGTC CTCCTTGAAA TCGCCGATCT TAAAGTGCAC 
TTTGAAATCA AAGATGGCAA ACAGTGGTTC TGGCAACCGC CGAAAACGCT CAAAGCCGTC 
GATGGTGTCA CTCTTCGCCT GTATGAAGGG GAAACATTAG GTGTGGTAGG GGAATCGGGA 
TGCGGTAAGT CCACCTTTGC TCGCGCCATC ATCGGTTTGG TCAAGGCGAC CGACGGTCAT 
GTTGCCTGGT TAGGTAAAGA GTTGCTGGGC ATGAAGCCCG ATGAATGGCG TGCCGTTCGC 
AGTGATATTC AGATGATTTT CCAGGATCCG TTGGCATCGC TAAACCCGCG TATGACCATC 
GGCGAGATCA TCGCTGAACC ACTGCGTACT TATCATCCGA AAATGTCACG CCAGGAAGTT 
CGCGAGCGCG TGAAGGCGAT GATGCTGAAA GTCGGGTTAT TGCCTAACCT GATTAACCGC 
TATCCGCATG AGTTCTCCGG TGGGCAGTGC CAGCGTATCG GGATTGCTCG TGCTCTTATT 
CTTGAACCGA AGCTGATTAT CTGCGATGAG CCGGTGTCGG CGCTGGACGT GTCAATTCAG 
GCGCAGGTGG TCAACCTGCT CCAGCAGCTG CAACGTGAGA TGGGATTGTC ATTAATTTTT 
ATCGCTCATG ACCTGGCCGT GGTAAAACAC ATTTCCGATC GTGTGTTGGT GATGTATCTC 
GGCCATGCGG TAGAACTGGG GACCTATGAT GAGGTCTACC ACAATCCACT ACATCCTTAC 
ACCAGGGCAT TGATGTCGGC AGTCCCCATA CCTGATCCGG ATCTGGAGAA GAACAAAACC 
ATCCAGTTAC TGGAAGGGGA ATTACCGTCG CCGATCAACC CGCCTTCCGG TTGTGTTTTC 
CGTACCCGTT GCCCGATTGC CGGTCCGGAG TGCGCCAAAA CACGTCCTGT TCTGGAGGGG 
AGTTTCAGAC ACGCCGTTTC TTGCCTGAAA GTCGATCCGC TTTAA

Protein sequence

MNAVTEGRKV LLEIADLKVH FEIKDGKQWF WQPPKTLKAV DGVTLRLYEG ETLGVVGESG 
CGKSTFARAI IGLVKATDGH VAWLGKELLG MKPDEWRAVR SDIQMIFQDP LASLNPRMTI 
GEIIAEPLRT YHPKMSRQEV RERVKAMMLK VGLLPNLINR YPHEFSGGQC QRIGIARALI 
LEPKLIICDE PVSALDVSIQ AQVVNLLQQL QREMGLSLIF IAHDLAVVKH ISDRVLVMYL 
GHAVELGTYD EVYHNPLHPY TRALMSAVPI PDPDLEKNKT IQLLEGELPS PINPPSGCVF 
RTRCPIAGPE CAKTRPVLEG SFRHAVSCLK VDPL