Gene EcSMS35_3911 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3911
Symbol
ID	6146208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3983271
End bp	3984407
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	51%
IMG OID	641618738
Product	membrane fusion protein family protein
Protein accession	YP_001745877
Protein GI	170680467
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTTAC TGATTATTTT AACCTATGTG GCTTTCGCAT GGGCAATGTT TAAGATCTTT 
AAAATTCCTG TAAATAAATG GACCATTCCC ACAGCGGCCC TGGGAGGCAT ATTTATTGTC 
AGCGGTCTAA TTCTGTTAAT GAACTATAAC CATCCGTATA CCTTTAAAGC GCAAAAAGCG 
GTTATTTCTA TTCCTGTTGT CCCACAGGTG ACAGGCGTGG TGATCGAAGT GACGGACAAG 
AAAAATACGC TGATTAAAAA AGGTGAGGTG CTATTTCGAC TGGACCCGAC GCGTTATCAG 
GCGCGGGTGG ATCGGCTGAT GGCGGATATC GTTACCGCAG AACATAAACA GCGGGCGTTG 
GGCGCAGAGT TAGATGAGAT GGCGGCGAAT ACTCAGCAGG CAAAGGCCAC GCGGGATAAA 
TTCGCTAAAG AGTATCAGCG TTACGCACGC GGCAGTCAGG CGAAAGTAAA CCCGTTTTCA 
GAACGCGATA TCGATGTGGC GCGGCAAAAT TATCTGGCGC AGGAAGCCTC CGTGAAGTCA 
TCGGCGGCGG AACAAAAACA GATCCTGAGC CAGCTGGATA GCCTGGTGTT GGGTGAACAT 
TCTCAAATCG CCAGCCTGAA AGCGCAGCTC GCGGAAGCAA AATATAACCT TGAGCAGACG 
ATAGTGCGTG CGCCGAGCGA TGGTTATGTG ACCCAGGTAC TGATTCGTCC GGGTACCTAT 
GCCGCGTCGC TGCCGCTACG TCCGGTGATG GTGTTTATAC CCGATCAGAA ACGACAAATC 
GTGGCGCAGT TCCGTCAGAA CTCCTTGCTG CGACTGGCTC CTGGCGACGA TGCGGAAGTG 
GTGTTTAATG CTCTGCCAGG TAAGGTATTC AGCGGTAAGC TGGCAGCCAT TAGTCCAGCC 
GTTCCCGGCG GAGCTTATCA GTCGACCGGC ACCTTACAGA CGTTAAACAC AGCGCCGGGT 
TCAGATGGCG TTATCGCGAC CATTGAACTG GATGAGCATA CTGATTTGAG CGCATTACCA 
GACGGTATTT ACGCCCAGGT GGCGGTCTAC TCTGATCATT TCAGCCATGT CTCGGTGATG 
CGCAAAGTAC TGTTACGCAT GACCAGCTGG GTGCATTACC TTTATCTCGA TCATTAA

Protein sequence

MDLLIILTYV AFAWAMFKIF KIPVNKWTIP TAALGGIFIV SGLILLMNYN HPYTFKAQKA 
VISIPVVPQV TGVVIEVTDK KNTLIKKGEV LFRLDPTRYQ ARVDRLMADI VTAEHKQRAL 
GAELDEMAAN TQQAKATRDK FAKEYQRYAR GSQAKVNPFS ERDIDVARQN YLAQEASVKS 
SAAEQKQILS QLDSLVLGEH SQIASLKAQL AEAKYNLEQT IVRAPSDGYV TQVLIRPGTY 
AASLPLRPVM VFIPDQKRQI VAQFRQNSLL RLAPGDDAEV VFNALPGKVF SGKLAAISPA 
VPGGAYQSTG TLQTLNTAPG SDGVIATIEL DEHTDLSALP DGIYAQVAVY SDHFSHVSVM 
RKVLLRMTSW VHYLYLDH