Gene EcHS_A3803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3803
Symbol
ID	5591769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3796773
End bp	3797909
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	53%
IMG OID	640922915
Product	membrane fusion protein family protein
Protein accession	YP_001460393
Protein GI	157163075
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	0.456542
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCTAT TGATTGTTTT AACTTACGTG GCGCTGGCGT GGGCGGTCTT TAAAATCTTT 
CGTATTCCGG TGAATCAGTG GACGCTGGCG ACGGCGGCGC TGGGTGGCGT GTTTCTGGTG 
AGTGGTTTGA TTTTGTTGAT GAACTACAAC CACCCTTACA CTTTTACCGC GCAAAAGGCA 
GTGATAGCGA TCCCCATCAC GCCACAGGTG ACGGGAATTG TTACTGAAGT CACTGACAAG 
AATAATCAGC TTATTCAAAA GGGCGAGGTG CTTTTTAAGC TCGACCCGGT TCGTTACCAG 
GCGCGAGTTG ACAGGCTTCA GGCTGACCTG ATGACGGCGA CGCATAATAT AAAGACTCTG 
CGCGCGCAGC TCACAGAAGC GCAGGCCAAC ACCACCCAGG TTTCAGCGGA GCGCGACCGT 
CTGTTTAAAA ATTATCAACG TTATCTGAAA GGCAGCCAGG CGGCGGTGAA TCCGTTCTCG 
GAACGTGACA TCGACGATGC GCGGCAAAAT TTCCTCGCGC AGGATGCGCT GGTGAAAGGC 
TCGGTGGCGG AGCAGGCGCA GATCCAGAGC CAGCTCGACA GTATGGTTAA CGGCGAGCAA 
TCGCAGATTG TGAGCTTAAG AGCGCAACTT ACTGAAGCAA AATATAATCT TGAGCAGACT 
GTCATTCGCG CACCAAGCAA TGGCTACGTC ACTCAGGTAC TGATCCGCCC AGGCACATAC 
GCAGCTGCCT TGCCGTTGCG TCCGGTGATG GTTTTCATCC CCGAGCAAAA ACGGCAAATT 
GTCGCCCAAT TTCGGCAAAA CTCGCTGTTA CGTCTGAAAC CTGGTGATGA TGCAGAAGTG 
GTGTTTAACG CGCTACCTGG GCAGGTGTTC CACGGCAAAC TGACCAGTAT TTTACCTGTC 
GTGCCAGGCG GTTCTTATCA GGCGCAGGGG GTATTGCAAT CATTAACGGT CGTGCCCGGC 
ACGGACGGTG TGCTGGGAAC CATTGAACTG GACCCTAACG ATGATATCGA TGCCTTACCC 
GACGGCATCT ACGCCCAGGT GGCGGTTTAC TCCGACCATT TCAGCCATGT TTCGGTGATG 
CGGAAAGTGC TGCTAAGAAT GACCAGCTGG ATGCATTATC TTTATTTGGA TCATTGA

Protein sequence

MDLLIVLTYV ALAWAVFKIF RIPVNQWTLA TAALGGVFLV SGLILLMNYN HPYTFTAQKA 
VIAIPITPQV TGIVTEVTDK NNQLIQKGEV LFKLDPVRYQ ARVDRLQADL MTATHNIKTL 
RAQLTEAQAN TTQVSAERDR LFKNYQRYLK GSQAAVNPFS ERDIDDARQN FLAQDALVKG 
SVAEQAQIQS QLDSMVNGEQ SQIVSLRAQL TEAKYNLEQT VIRAPSNGYV TQVLIRPGTY 
AAALPLRPVM VFIPEQKRQI VAQFRQNSLL RLKPGDDAEV VFNALPGQVF HGKLTSILPV 
VPGGSYQAQG VLQSLTVVPG TDGVLGTIEL DPNDDIDALP DGIYAQVAVY SDHFSHVSVM 
RKVLLRMTSW MHYLYLDH