Gene EcHS_A3790 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3790
Symbol
ID	5595172
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3782266
End bp	3783402
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	51%
IMG OID	640922904
Product	membrane fusion protein family protein
Protein accession	YP_001460382
Protein GI	157163064
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTTAC TGATTATTTT GACCTATGTG GCTTTTGCAT GGGCAATGTT TAAGATCTTC 
AAAATTCCTG TAAATAAATG GACCATTCCC ACAGCGGCTC TGGGTGGCAT ATTTATTGTC 
AGTGGTTTAA TTCTGTTAAT GAACTATAAC CATCCGTATA CCTTCAAAGC GCAAAAAGCG 
GTTATTTCTA TTCCTGTTGT CCCACAGGTG ACAGGCGTGG TGATCGAAGT GACGGATAAG 
AAAAATACGC TGATTAAAAA AGGTGAGGTG CTATTTCGAC TGGACCCGAC GCGTTATCAG 
GCGCGGGTGG ATCGGCTGAT GGCGGATATC GTTACCGCAG AACATAAACA GCGGGCGTTG 
GGCGCAGAGT TAGATGAGAT GGCGGCGAAT ACTCAGCAGG CAAAGGCCAC GCGGGATAAA 
TTCGCTAAAG AGTATCAGCG TTACGCACGC GGCAGCCAGG CGAAAGTAAA CCCGTTTTCA 
GAACGCGATA TTGATGTGGC GCGGCAAAAT TATCTGGCGC AGGAAGCCTC CGTAAAGTCA 
TCGGCGGCGG AACAAAAACA GATCCAGAGC CAGCTGGATA GCCTGGTGTT GGGTGAACAT 
TCTCAAATCG CCAGCCTGAA AGCGCAGCTC GCGGAAGCAA AATATAACCT TGAGCAGACG 
ATAGTGCGTG CGCCGAGCGA TGGTTATGTG ACCCAGGTGC TGATTCGTCC GGGTACCTAT 
GCCGCGTCGC TGCCGCTACG TCCGGTGATG GTGTTTATAC CCGATCAGAA ACGACAAATC 
GTGGCGCAGT TCCGTCAGAA CTCCTTGCTG CGCCTGGCTC CCGGCGATGA TGCGGAAGTG 
GTATTTAACG CTCTGCCAGG CAAAGTGTTC AGCGGTAAGC TGGCAGCCAT TAGTCCAGCT 
GTTCCCGGCG GAGCTTATCA GTCGACCGGC ACCTTACAGA CGTTAAACAT AGCGCCGGGT 
TCAGATGGCG TTATCGCGAC CATTGAACTA GATGAGCACA CTGATTTGAG CGCTTTACCA 
GACGGTATTT ACGCCCAGGT GGCGGTCTAC TCTGATCATT TCAGCCATGT CTCGGTGATG 
CGCAAAGTGC TGTTACGCAT GACCAGTTGG GTGCATTACC TTTATCTCGA TCATTAA

Protein sequence

MDLLIILTYV AFAWAMFKIF KIPVNKWTIP TAALGGIFIV SGLILLMNYN HPYTFKAQKA 
VISIPVVPQV TGVVIEVTDK KNTLIKKGEV LFRLDPTRYQ ARVDRLMADI VTAEHKQRAL 
GAELDEMAAN TQQAKATRDK FAKEYQRYAR GSQAKVNPFS ERDIDVARQN YLAQEASVKS 
SAAEQKQIQS QLDSLVLGEH SQIASLKAQL AEAKYNLEQT IVRAPSDGYV TQVLIRPGTY 
AASLPLRPVM VFIPDQKRQI VAQFRQNSLL RLAPGDDAEV VFNALPGKVF SGKLAAISPA 
VPGGAYQSTG TLQTLNIAPG SDGVIATIEL DEHTDLSALP DGIYAQVAVY SDHFSHVSVM 
RKVLLRMTSW VHYLYLDH