Gene EcolC_0204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0204
Symbol
ID	6064464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	234266
End bp	235423
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	55%
IMG OID	641599605
Product	multidrug efflux system protein MdtE
Protein accession	YP_001723212
Protein GI	170018258
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0378135
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGAA GAAGAAAGCT GTTAATACCG TTGTTATTCT GCGGCGCGAT GCTCACCGCC 
TGCGATGACA AATCGGCGGA AAACGCCGCC GCCATGACGC CTGAGGTCGG TGTCGTCACA 
CTCTCCCCCG GTTCGGTCAA TGTGTTGAGC GAATTGCCCG GTAGAACCGT TCCTTATGAA 
GTTGCCGAGA TACGTCCCCA GGTGGGCGGT ATTATCATTA AACGCAACTT TATCGAAGGC 
GATAAAGTGA ACCAGGGCGA TTCGCTGTAT CAGATTGATC CTGCACCTTT ACAGGCCGAG 
CTAAACTCCG CCAAAGGCTC GCTGGCGAAA GCGCTCTCTA CCGCCAGCAA TGCCCGCATC 
ACCTTTAACC GCCAGGCATC GTTGCTGAAG ACCAACTACG TTAGCCGTCA GGATTACGAC 
ACCGCGCGCA CCCAGTTGAA TGAAGCAGAA GCCAATGTCA CCGTCGCCAA AGCGGCTGTT 
GAACAGGCGA CGATCAATCT GCAATACGCG AATGTCACCT CGCCGATTAC GGGCGTCAGC 
GGGAAATCGT CGGTGACCGT CGGCGCACTC GTTACCGCTA ATCAGGCAGA TTCGCTGGTT 
ACCGTACAAC GTCTGGACCC GATTTATGTC GATCTCACGC AGTCGGTGCA AGATTTCTTA 
CGCATGAAAG AAGAGGTCGC CAGTGGGCAA ATCAAACAGG TTCAGGGCAG TACGCCAGTA 
CAGCTCAATC TGGAAAATGG TAAACGCTAC AGCCAGACCG GCACGCTGAA ATTCTCCGAC 
CCGACAGTGG ATGAAACCAC GGGCTCCGTG ACGTTACGGG CGATTTTCCC CAACCCAAAT 
GGTGACTTGC TGCCTGGCAT GTACGTCACG GCATTAGTGG ATGAAGGTAG CCGCCAGAAT 
GTATTACTGG TGCCGCAGGA AGGCGTCACC CACAACGCCC AGGGTAAAGC AACGGCGCTC 
ATTCTGGATA AAGACGATGT CGTGCAGCTA CGCGAAATTG AAGCCAGCAA AGCCATCGGC 
GACCAGTGGG TCGTCACCTC TGGCTTGCAG GCTGGCGATC GGGTGATCGT TTCCGGTTTG 
CAACGCATTC GTCCGGGTAT CAAAGCACGA GCAATTTCCT CCAGCCAGGA AAACGCCAGC 
ACCGAATCGA AACAATAA

Protein sequence

MNRRRKLLIP LLFCGAMLTA CDDKSAENAA AMTPEVGVVT LSPGSVNVLS ELPGRTVPYE 
VAEIRPQVGG IIIKRNFIEG DKVNQGDSLY QIDPAPLQAE LNSAKGSLAK ALSTASNARI 
TFNRQASLLK TNYVSRQDYD TARTQLNEAE ANVTVAKAAV EQATINLQYA NVTSPITGVS 
GKSSVTVGAL VTANQADSLV TVQRLDPIYV DLTQSVQDFL RMKEEVASGQ IKQVQGSTPV 
QLNLENGKRY SQTGTLKFSD PTVDETTGSV TLRAIFPNPN GDLLPGMYVT ALVDEGSRQN 
VLLVPQEGVT HNAQGKATAL ILDKDDVVQL REIEASKAIG DQWVVTSGLQ AGDRVIVSGL 
QRIRPGIKAR AISSSQENAS TESKQ