Gene EcolC_0441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0441
Symbol
ID	6067987
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	479921
End bp	481078
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	52%
IMG OID	641599847
Product	RND family efflux transporter MFP subunit
Protein accession	YP_001723446
Protein GI	170018492
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.693626
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAAAC ATGCCAGGTT TTTCCTCCTG CCCTCCTTTA TTCTGATCTC CGCGGCTTTA 
ATCGCCGGTT GTAACGATAA GGGAGAAGAG AAAGCTCACG TCGGTGAACC GCAGGTTACC 
GTTCATATTG TGAAAACGGC CCCGTTAGAA GTTAAGACTG AATTACCAGG CCGCACCAAT 
GCTTACCGTA TAGCCGAAGT TCGCCCACAG GTTAGCGGGA TCGTACTGAA TCGTAATTTC 
ACTGAAGGCA GCGATGTACA AGCAGGCCAG TCCCTGTACC AGATCGATCC CGCGACCTAT 
CAGGCAAATT ATGACAGCGC GAAAGGCGAA CTGGCGAAAA GTGAAGCCGC CGCCGCCATC 
GCGCATTTGA CGGTAAAACG TTACGTTCCG CTCGTGGGTA CGAAATACAT CAGCCAGCAG 
GAGTACGACC AGGCCATTGC TGATGCTCGC CAGGCCGATG CCGCCGTGAT TGCCGCAAAA 
GCCACAGTCG AAAGCGCTCG CATCAATCTC GCTTATACCA AAGTGACTGC GCCAATTAGC 
GGACGTATCG GCAAATCGAC CGTGACCGAA GGCGCTCTTG TCACTAATGG GCAAACGACT 
GAACTGGCGA CTGTCCAGCA GCTCGATCCT ATCTACGTTG ATGTGACCCA ATCCAGCAAC 
GATTTTATGA GGCTGAAGCA ATCCGTAGAG CAAGGAAATT TGCATAAGGA AAACGCCACC 
AGCAACGTAG AGTTGGTCAT GGAAAACGGT CAAACCTATC CCCTGAAAGG TACGCTGCAA 
TTCTCTGATG TGACCGTTGA TGAAAGCACC GGCTCCATAA CCCTACGTGC TGTCTTCCCT 
AACCCGCAAC ATACGCTTTT GCCGGGTATG TTTGTGCGTG CACGGATTGA TGAAGGCGTC 
CAACCTGACG CCATTCTTAT CCCGCAACAA GGCGTTAGCC GCACACCGCG TGGTGATGCA 
ACCGTGCTGA TTGTTAACGA TAAAAGTCAG GTGGAAGCGC GCCCTGTCGT TGCCAGTCAG 
GCGATTGGCG ATAAATGGTT GATTAGCGAA GGTCTGAAAT CTGGCGATCA AGTCATTGTC 
AGCGGCCTGC AAAAAGCGCG TCCGGGAGAG CAGGTTAAAG CCACTACCGA TACCCCCGCA 
GATACTGCAT CGAAGTAA

Protein sequence

MTKHARFFLL PSFILISAAL IAGCNDKGEE KAHVGEPQVT VHIVKTAPLE VKTELPGRTN 
AYRIAEVRPQ VSGIVLNRNF TEGSDVQAGQ SLYQIDPATY QANYDSAKGE LAKSEAAAAI 
AHLTVKRYVP LVGTKYISQQ EYDQAIADAR QADAAVIAAK ATVESARINL AYTKVTAPIS 
GRIGKSTVTE GALVTNGQTT ELATVQQLDP IYVDVTQSSN DFMRLKQSVE QGNLHKENAT 
SNVELVMENG QTYPLKGTLQ FSDVTVDEST GSITLRAVFP NPQHTLLPGM FVRARIDEGV 
QPDAILIPQQ GVSRTPRGDA TVLIVNDKSQ VEARPVVASQ AIGDKWLISE GLKSGDQVIV 
SGLQKARPGE QVKATTDTPA DTASK