Gene EcolC_0115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0115
Symbol
ID	6065097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	123447
End bp	124583
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	53%
IMG OID	641599517
Product	secretion protein HlyD family protein
Protein accession	YP_001723126
Protein GI	170018172
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0435233
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTAT TGATTGTTTT AACTTACGTG GCGCTGGCGT GGGCGGTCTT TAAAATCTTC 
CGCATTCCGG TAAATCAGTG GACGCTGGCG ACGGCGGCGC TGGGAGGCGT GTTTCTGGTG 
AGTGGTTTGA TTTTGTTGAT GAACTACAAC CACCCTTACA CTTTTACCGC GCAAAAGGCA 
GTGATAGCGA TCCCTATCAC GCCACAGGTG ACGGGAATTG TTACTGAAGT CACTGACAAG 
AATAATCAGC TTATTCAAAA GGGCGAGGTG CTTTTTAAGC TCGACCCGGT TCGTTACCAG 
GCGCGAGTTG ACAGACTTCA GGCTGACCTG ATGACGGCGA CGCATAATAT AAAGACGCTG 
CGTGCGCAGC TCACTGAAGC GCAGGCCAAC ACCACCCAGG TTTCAGCGGA GCGCGACCGT 
CTGTTTAAAA ATTATCAACG TTACTTGAAT GGCAGCCAGG CGGCGGTGAA TCCGTTCTCG 
GAACGTGACA TCGACGATGC GCGGCAAAAT TTCCTCGCGC AGGATGCGCT GGTGAAAGGC 
TCGGTGGCGG AGCAGGCGCA GATCCAGAGC CAGCTCGACA GTATGGTTAA CGGCGAGCAA 
TCGCAGATTG TGAGCTTAAG AGCGCAACTT ACTGAAGCAA AATATAACCT TGAGCAGACT 
GTCATTCGCG CGCCGAGCAA TGGCTACGTT ACTCAGGTAC TGATCCGCCC AGGTACATAC 
GCAGCTGCCT TGCCGCTGCG TCCGGTGATG GTCTTCATCC CCGAGCAAAA ACGGCAAATT 
GTCGCCCAAT TTCGGCAAAA CTCGCTGTTA CGTCTGAAAC CCGGCGATGA TGCGGAAGTG 
GTGTTTAACG CGCTACCTGG GCAGGTGTTT CACGGCAAAC TGACTAGTAT TTTACCTGTC 
GTGCCAGGCG GTTCTTATCA GGCGCAGGGG GTATTGCAAT CATTAACGGT CGTGCCCGGC 
ACGGACGGTG TGCTGGGAAC CATTGAACTG GACCCTAACG ATGATATCGA TGCCTTACCC 
GACGGCATCT ACGCCCAGGT GGCGGTTTAC TCCGACCATT TCAGCCATGT TTCGGTGATG 
CGGAAAGTGC TGCTAAGAAT GACCAGCTGG ATGCATTATC TTTATTTGGA TCATTGA

Protein sequence

MDLLIVLTYV ALAWAVFKIF RIPVNQWTLA TAALGGVFLV SGLILLMNYN HPYTFTAQKA 
VIAIPITPQV TGIVTEVTDK NNQLIQKGEV LFKLDPVRYQ ARVDRLQADL MTATHNIKTL 
RAQLTEAQAN TTQVSAERDR LFKNYQRYLN GSQAAVNPFS ERDIDDARQN FLAQDALVKG 
SVAEQAQIQS QLDSMVNGEQ SQIVSLRAQL TEAKYNLEQT VIRAPSNGYV TQVLIRPGTY 
AAALPLRPVM VFIPEQKRQI VAQFRQNSLL RLKPGDDAEV VFNALPGQVF HGKLTSILPV 
VPGGSYQAQG VLQSLTVVPG TDGVLGTIEL DPNDDIDALP DGIYAQVAVY SDHFSHVSVM 
RKVLLRMTSW MHYLYLDH