Gene EcHS_A3458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3458
Symbol	acrE
ID	5591446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3458207
End bp	3459364
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	52%
IMG OID	640922576
Product	acriflavine resistance protein E
Protein accession	YP_001460064
Protein GI	157162746
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0000310651
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGAAAC ATGCCAGGTT TTTCCTCCTG CCCTCCTTTA TTCTGATCTC CGCGGCTTTA 
ATCGCCGGTT GTAACGATAA GGGAGAAGAG AAAGCTCACG TCGGTGAACC GCAGGTTACC 
GTTCATATTG TGAAAACGGC CCCGTTAGAA GTTAAGACTG AATTACCAGG CCGCACCAAT 
GCTTACCGTA TAGCCGAAGT TCGCCCACAG GTTAGCGGGA TCGTACTGAA TCGTAATTTC 
ACTGAAGGCA GCGATGTACA AGCAGGCCAG TCCCTGTACC AGATCGATCC CGCGACCTAT 
CAGGCAAATT ATGACAGCGC GAAAGGCGAA CTGGCGAAAA GTGAAGCCGC CGCCGCCATC 
GCGCATTTGA CGGTAAAACG TTACGTTCCG CTCGTGGGTA CGAAATACAT CAGCCAGCAG 
GAGTACGACC AGGCCATTGC TGATGCTCGC CAGGCCGATG CCGCCGTGAT TGCCGCAAAA 
GCCACAGTCG AAAGCGCTCG CATCAATCTC GCTTATACCA AAGTGACTGC GCCAATTAGC 
GGACGTATCG GCAAATCGAC CGTGACCGAA GGCGCTCTTG TCACTAATGG GCAAACGACT 
GAACTGGCGA CTGTCCAGCA GCTCGATCCT ATCTACGTTG ATGTGACCCA ATCCAGCAAC 
GATTTTATGA GGCTGAAGCA ATCCGTAGAG CAAGGAAATT TGCATAAGGA AAACGCCACC 
AGCAACGTAG AGTTGGTCAT GGAAAACGGT CAAACCTATC CCCTGAAAGG TACGCTGCAA 
TTCTCTGATG TGACCGTTGA TGAAAGCACC GGCTCCATAA CCCTACGTGC TGTCTTCCCT 
AACCCGCAAC ATACGCTTTT GCCGGGTATG TTTGTGCGTG CACGGATTGA TGAAGGCGTC 
CAACCTGACG CCATTCTTAT CCCGCAACAA GGCGTTAGCC GCACACCGCG TGGTGATGCA 
ACCGTGCTGA TTGTTAACGA TAAAAGTCAG GTGGAAGCGC GCCCTGTCGT TGCCAGTCAG 
GCGATTGGCG ATAAATGGTT GATTAGCGAA GGTCTGAAAT CTGGCGATCA AGTCATTGTC 
AGCGGCCTGC AAAAAGCGCG TCCGGGAGAG CAGGTTAAAG CCACTACCGA TACCCCCGCA 
GATACTGCAT CGAAGTAA

Protein sequence

MTKHARFFLL PSFILISAAL IAGCNDKGEE KAHVGEPQVT VHIVKTAPLE VKTELPGRTN 
AYRIAEVRPQ VSGIVLNRNF TEGSDVQAGQ SLYQIDPATY QANYDSAKGE LAKSEAAAAI 
AHLTVKRYVP LVGTKYISQQ EYDQAIADAR QADAAVIAAK ATVESARINL AYTKVTAPIS 
GRIGKSTVTE GALVTNGQTT ELATVQQLDP IYVDVTQSSN DFMRLKQSVE QGNLHKENAT 
SNVELVMENG QTYPLKGTLQ FSDVTVDEST GSITLRAVFP NPQHTLLPGM FVRARIDEGV 
QPDAILIPQQ GVSRTPRGDA TVLIVNDKSQ VEARPVVASQ AIGDKWLISE GLKSGDQVIV 
SGLQKARPGE QVKATTDTPA DTASK