Gene EcHS_A3886 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3886
Symbol	emrD
ID	5592823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3883503
End bp	3884687
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	57%
IMG OID	640922996
Product	multidrug resistance protein D
Protein accession	YP_001460473
Protein GI	157163155
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGGC AAAGAAACGT CAATTTGTTA TTGATGTTGG TATTACTCGT GGCCGTCGGT 
CAGATGGCGC AAACCATTTA TATTCCAGCT ATTGCCGATA TGGCGCGCGA TCTCAACGTC 
CGTGAAGGGG CGGTGCAGAG CGTAATGGGC GCTTATCTGC TGACTTACGG TGTCTCACAG 
CTGTTTTATG GCCCGATTTC CGACCGCGTG GGCCGCCGAC CGGTGATCCT CGTCGGAATG 
TCCATTTTTA TGCTGGCAAC GCTGGTCGCG GTCACGACCT CCAGTTTGAC GGTGTTGATT 
GCCGCCAGCG CGATGCAGGG GATGGGCACC GGCGTTGGCG GCGTAATGGC GCGTACTTTG 
CCGCGAGATT TATATGAACG GACACAGTTG CGCCATGCTA ACAGCCTGTT AAACATGGGG 
ATTCTCGTCA GTCCGTTGCT CGCACCGCTA ATCGGCGGTC TGCTGGATAC GATGTGGAAC 
TGGCGCGCCT GTTATCTCTT TTTGTTGGTT CTTTGTGCTG GTGTGACCTT CAGTATGGCC 
CGCTGGATGC CGGAAACGCG TCCGGTCGAT GCACCGCGCA CGCGCCTGCT TACCAGTTAT 
AAAACGCTTT TCGGTAACAG CGGTTTTAAC TGTTATTTGC TGATGCTGAT TGGCGGTCTG 
GCCGGGATTG CCGCCTTTGA AGCCTGCTCC GGCGTGCTGA TGGGCGCGGT GTTAGGGCTG 
AGCAGTATGA CGGTCAGTAT TTTGTTTATT CTGCCGATTC CGGCAGCGTT TTTTGGCGCA 
TGGTTTGCCG GACGTCCCAA TAAACGCTTC TCCACGTTAA TGTGGCAGTC GGTTATCTGC 
TGCCTGCTGG CTGGCTTGCT GATGTGGATC CCCGACTGGT TTGGCGTGAT GAATGTCTGG 
ACGCTGCTCG TTCCCGCCGC GCTGTTCTTT TTCGGTGCCG GGATGCTGTT TCCGCTGGCG 
ACCAGCGGCG CGATGGAGCC GTTCCCCTTC CTGGCGGGCA CGGCTGGCGC GCTGGTCGGC 
GGTCTGCAAA ACATTGGTTC CGGCGTGCTG GCGTCGCTCT CTGCGATGTT GCCGCAAACC 
GGTCAGGGTA GCCTGGGGTT ATTGATGACC TTAATGGGAT TGTTGATCGT GCTGTGCTGG 
CTGCCGCTGG CGACGCGGAT GTCGCATCAG GGGCAGCCCG TTTAA

Protein sequence

MKRQRNVNLL LMLVLLVAVG QMAQTIYIPA IADMARDLNV REGAVQSVMG AYLLTYGVSQ 
LFYGPISDRV GRRPVILVGM SIFMLATLVA VTTSSLTVLI AASAMQGMGT GVGGVMARTL 
PRDLYERTQL RHANSLLNMG ILVSPLLAPL IGGLLDTMWN WRACYLFLLV LCAGVTFSMA 
RWMPETRPVD APRTRLLTSY KTLFGNSGFN CYLLMLIGGL AGIAAFEACS GVLMGAVLGL 
SSMTVSILFI LPIPAAFFGA WFAGRPNKRF STLMWQSVIC CLLAGLLMWI PDWFGVMNVW 
TLLVPAALFF FGAGMLFPLA TSGAMEPFPF LAGTAGALVG GLQNIGSGVL ASLSAMLPQT 
GQGSLGLLMT LMGLLIVLCW LPLATRMSHQ GQPV