Gene EcHS_A3686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3686
Symbol
ID	5594307
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3675804
End bp	3676871
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	59%
IMG OID	640922800
Product	MFP family transporter
Protein accession	YP_001460280
Protein GI	157162962
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	67
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAGA GTAAGCGCCA TCTGGCGTGG TGGGTTGTCG GGTTACTGGC GGTGGCGGCT 
ATCGTGGCGT GGTGGCTGTT GCGCCCGGCA GGTGTGCCGG AAGGCTTTGC CGTCAGCAAT 
GGGCGCATTG AAGCGACGGA AGTGGATATC GCCAGCAAAA TTGCCGGGCG TATCGACACC 
ATTCTGGTGA AAGAAGGCCA GTTTGTTCGC GAAGGCGAAG TGCTGGCGAA GATGGATACT 
CGCGTGTTGC AGGAACAGCG ACTGGAAGCC ATCGCGCAAA TCAAAGCAGC ACAAAGTGCC 
GTTGCTGCCG CGCAGGCTTT GCTGGAGCAA CGGCAAAGCG AAACTCGTGC CGCGCAGTCG 
CTGGTTAATC AACGCCAGGC CGAACTGGAC TCCGTGGCTA AACGTCATAC GCGTTCCCGC 
TCGCTCGCCC AACGAGGGGC TATTTCTGCG CAACAGCTGG ATGACGATCG CGCCGCCGCT 
GAGAGCGCCC GAGCTGCGCT GGAATCGGCG AAAGCTCAGG TATCGGCTTC TAAAGCGGCT 
ATAGAAGCGG CACGCACCAA TATCATTCAG GCGCAAACTC GCGTCGAAGC CGCACAAGCC 
ACTGAACGGC GCATTGCCGC AGATATCGAT GACAGCGAAC TGAAAGCCCC GCGTGATGGA 
CGCGTACAAT ATCGCGTTGC CGAGCCAGGG GAAGTGCTGG CGGCAGGCGG TCGGGTGCTG 
AATATGGTCG ATCTCAGCGA CGTCTATATG ACTTTCTTCC TGCCAACCGA ACAGGCGGGC 
ACGCTGAAAC TTGGCGGTGA AGCCCGGCTG ATCCTCGATG CCGCGCCAGA TCTGCGTATT 
CCGGCGACCA TCAGTTTTGT CGCCAGTGTC GCCCAGTTCA CGCCAAAAAC CGTCGAAACC 
AGCGATGAAC GGCTGAAACT GATGTTCCGC GTCAAAGCGC GTATCCCACC GGAATTACTC 
CAGCAGCATC TGGAATATGT CAAAACCGGT TTACCGGGCG TAGCGTGGGT GCGGGTGAAT 
GAAGAACTTC CGTGGCCTGA CGACCTCGTG GTGAGGTTGC CGCAATGA

Protein sequence

MDKSKRHLAW WVVGLLAVAA IVAWWLLRPA GVPEGFAVSN GRIEATEVDI ASKIAGRIDT 
ILVKEGQFVR EGEVLAKMDT RVLQEQRLEA IAQIKAAQSA VAAAQALLEQ RQSETRAAQS 
LVNQRQAELD SVAKRHTRSR SLAQRGAISA QQLDDDRAAA ESARAALESA KAQVSASKAA 
IEAARTNIIQ AQTRVEAAQA TERRIAADID DSELKAPRDG RVQYRVAEPG EVLAAGGRVL 
NMVDLSDVYM TFFLPTEQAG TLKLGGEARL ILDAAPDLRI PATISFVASV AQFTPKTVET 
SDERLKLMFR VKARIPPELL QQHLEYVKTG LPGVAWVRVN EELPWPDDLV VRLPQ