Gene EcolC_1564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1564
Symbol
ID	6065361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1730226
End bp	1731641
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	55%
IMG OID	641600980
Product	multidrug efflux system protein MdtE
Protein accession	YP_001724550
Protein GI	170019596
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.886181
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.734188
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGATC TTCCCGACAG CACCCGTTGG CAATTGTGGA TTGTGGCTTT CGGCTTCTTT 
ATGCAGTCGC TGGACACCAC CATCGTAAAC ACCGCCCTTC CCTCAATGGC GCAAAGCCTC 
GGGGAAAGTC CGTTGCATAT GCACATGGTC ATTGTCTCTT ATGTGCTGAC CGTGGCGGTG 
ATGCTGCCCG CCAGCGGCTG GCTGGCGGAC AAAGTCGGCG TGCGCAATAT TTTCTTTACC 
GCCATCGTGC TGTTTACTCT CGGTTCACTG TTTTGCGCGC TTTCCGGCAC GCTGAACGAA 
CTGTTGCTGG CACGCGCGTT ACAGGGCGTT GGCGGCGCGA TGATGGTGCC GGTCGGCAGA 
TTGACGGTGA TGAAAATCGT ACCGCGCGAG CAATATATGG CGGCGATGAC CTTTGTCACG 
TTACCCGGTC AGGTCGGTCC GCTGCTCGGT CCGGCGCTCG GCGGTCTGCT GGTGGAGTAC 
GCATCGTGGC ACTGGATCTT TTTGATCAAC ATTCCGGTGG GGATTATCGG TGCGATCGCC 
ACATTGCTGT TAATGCCAAA CTACACCATG CAGACGCGGC GCTTTGATCT CTCCGGATTT 
TTATTGCTGG CGGTTGGCAT GGCGGTATTA ACCCTGGCGC TGGACGGCAG TAAAGGTACA 
GGTTTATCGC CGCTGACGAT TGCAGGCCTG GTCGCAGTTG GCGTGGTGGC ACTGGTGCTT 
TATCTGCTGC ACGCCAGAAA TAACAACCGT GCCCTGTTCA GTCTGAAACT GTTCCGTACT 
CGTACCTTTT CGCTGGGCCT GGCGGGGAGC TTTGCCGGAC GTATTGGCAG TGGCATGTTG 
CCCTTTATGA CACCGGTTTT CCTGCAAATT GGCCTCGGTT TCTCGCCGTT TCATGCCGGA 
CTGATGATGA TCCCGATGGT GCTTGGCAGC ATGGGAATGA AGCGAATTGT GGTACAGGTG 
GTGAATCGCT TTGGTTATCG TCGGGTACTG GTAGCGACCA CGCTGGGTCT GTCGCTGGTC 
ACCCTGTTGT TTATGACTAC CGCCCTGCTG GGCTGGTACT ACGTTTTGCC GTTCGTCCTG 
TTTTTACAAG GGATGGTCAA CTCGACGCGT TTCTCCTCCA TGAACACCCT GACGCTGAAA 
GATCTCCCGG ACAATCTGGC GAGCAGCGGC AACAGCCTGC TGTCGATGAT TATGCAATTG 
TCGATGAGTA TCGGCGTCAC TATCGCCGGG CTGTTGCTGG GACTTTTTGG TTCACAGCAT 
GTCAGCGTCG ACAGCGGCAC CACACAAACC GTCTTTATGT ACACCTGGCT TAGCATGGCG 
TTGATCATCG CCCTTCCGGC GTTCATCTTT GCCAGAGTGC CGAACGATAC GCATCAAAAT 
GTAGCTATTT CGCGGCGAAA AAGGAGCGCG CAATGA

Protein sequence

MTDLPDSTRW QLWIVAFGFF MQSLDTTIVN TALPSMAQSL GESPLHMHMV IVSYVLTVAV 
MLPASGWLAD KVGVRNIFFT AIVLFTLGSL FCALSGTLNE LLLARALQGV GGAMMVPVGR 
LTVMKIVPRE QYMAAMTFVT LPGQVGPLLG PALGGLLVEY ASWHWIFLIN IPVGIIGAIA 
TLLLMPNYTM QTRRFDLSGF LLLAVGMAVL TLALDGSKGT GLSPLTIAGL VAVGVVALVL 
YLLHARNNNR ALFSLKLFRT RTFSLGLAGS FAGRIGSGML PFMTPVFLQI GLGFSPFHAG 
LMMIPMVLGS MGMKRIVVQV VNRFGYRRVL VATTLGLSLV TLLFMTTALL GWYYVLPFVL 
FLQGMVNSTR FSSMNTLTLK DLPDNLASSG NSLLSMIMQL SMSIGVTIAG LLLGLFGSQH 
VSVDSGTTQT VFMYTWLSMA LIIALPAFIF ARVPNDTHQN VAISRRKRSA Q