Gene B21_03500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03500
Symbol	emrD
ID	8116275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	3740366
End bp	3741550
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	57%
IMG OID	644849671
Product	hypothetical protein
Protein accession	YP_003001244
Protein GI	251786940
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGGC AAAGAAACGT CAATTTGTTA TTGATGTTGG TATTACTCGT GGCCGTCGGT 
CAGATGGCGC AAACCATTTA TATTCCAGCT ATTGCCGATA TGGCGCGCGA TCTCAACGTC 
CGTGAAGGGG CGGTGCAGAG CGTAATGGGC GCTTATCTGC TGACTTACGG TGTCTCACAG 
CTGTTTTATG GCCCGATTTC CGACCGCGTG GGCCGCCGAC CGGTGATCCT CGTCGGAATG 
TCCATTTTTA TGCTGGCAAC GCTGGTCGCG GTCACGACCT CCAGTTTGAC GGTGTTGATT 
GCCGCCAGCG CGATGCAGGG GATGGGCACC GGCGTTGGCG GCGTAATGGC GCGTACTTTA 
CCGCGAGATT TATATGAACG GACACAGTTG CGCCATGCTA ACAGCCTGTT AAACATGGGG 
ATTCTCGTCA GTCCGTTGCT CGCACCGCTA ATCGGCGGTC TGCTGGATAC GATGTGGAAC 
TGGCGCGCCT GTTATCTCTT TTTGTTGGTT CTTTGTGCTG GTGTGACCTT CAGTATGGCC 
CGCTGGATGC CGGAAACGCG TCCGGTCGAT GCACCGCGCA CGCGCCTGCT TACCAGTTAT 
AAAACGCTTT TCGGTAACAG CGGTTTTAAC TGTTATTTGC TGATGCTGAT TGGCGGTCTG 
GCCGGGATTG CCGCCTTTGA AGCCTGCTCC GGCGTGCTGA TGGGCGCGGT GTTAGGGCTG 
AGCAGTATGA CGGTCAGTAT TTTGTTTATT CTGCCGATTC CGGCAGCGTT TTTTGGCGCA 
TGGTTTGCCG GACGTCCCAA TAAACGCTTC TCCACGTTAA TGTGGCAGTC GGTTATCTGC 
TGCCTGCTGG CTGGCTTGCT GATGTGGATC CCCGACTGGT TTGGCGTGAT GAATGTCTGG 
ACGCTGCTCG TTCCCGCCGC GCTGTTCTTT TTCGGTGCCG GGATGCTGTT TCCGCTGGCG 
ACCAGCGGCG CGATGGAGCC GTTCCCCTTC CTGGCGGGCA CGGCTGGCGC GCTGGTCGGC 
GGTCTGCAAA ACATTGGTTC CGGCGTGCTG GCGTCGCTCT CTGCGATGTT GCCGCAAACC 
GGTCAGGGTA GCCTGGGGTT ATTGATGACC TTAATGGGAT TGTTGATCGT GCTGTGCTGG 
CTGCCGCTGG CGACGCGGAT GTCGCATCAG GGGCAGCCCG TTTAA

Protein sequence

MKRQRNVNLL LMLVLLVAVG QMAQTIYIPA IADMARDLNV REGAVQSVMG AYLLTYGVSQ 
LFYGPISDRV GRRPVILVGM SIFMLATLVA VTTSSLTVLI AASAMQGMGT GVGGVMARTL 
PRDLYERTQL RHANSLLNMG ILVSPLLAPL IGGLLDTMWN WRACYLFLLV LCAGVTFSMA 
RWMPETRPVD APRTRLLTSY KTLFGNSGFN CYLLMLIGGL AGIAAFEACS GVLMGAVLGL 
SSMTVSILFI LPIPAAFFGA WFAGRPNKRF STLMWQSVIC CLLAGLLMWI PDWFGVMNVW 
TLLVPAALFF FGAGMLFPLA TSGAMEPFPF LAGTAGALVG GLQNIGSGVL ASLSAMLPQT 
GQGSLGLLMT LMGLLIVLCW LPLATRMSHQ GQPV