Gene EcolC_3947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3947
Symbol
ID	6064459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4332931
End bp	4334397
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	56%
IMG OID	641603360
Product	putative outer membrane efflux protein MdtP
Protein accession	YP_001726875
Protein GI	170021921
COG category	[M] Cell wall/membrane/envelope biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1538] Outer membrane protein
TIGRFAM ID	[TIGR01845] efflux transporter, outer membrane factor (OMF) lipoprotein, NodT family

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAATC GTCAACTTTC ACGTCTGCTG TTGTGCAGCA TTCTCGGCAG CACGACGCTG 
ATTTCCGGCT GTGCCCTGGT ACGTAAGGAT TCTGCACCTC ATCAACAGCT CAAACCGGAA 
CAAATCAAAC TGGCCGACGA TATTCATCTT GCCAGCTCCG GCTGGCCGCA GGCGCAGTGG 
TGGAAACAAC TCAATGACCC GCAGCTGGAT GCGCTGATCC AACGGACGCT AAGTGGTTCA 
CACACCCTCG CCGAAGCGAA ACTGCGGGAA GAAAAAGCGC AGTCCCAGGC CGATTTGTTA 
GATGCCGGTT CACAATTACA GGTCGCAGCG TTAGGGATGC TCAACCGCCA ACGTGTCTCG 
GCGAACGGCT TTTTAAGCCC TTATTCAATG GATGCGCCAG CACTGGGTAT GGACGGGCCG 
TACTATACGG AAGCCACAGT AGGTTTGTTT GCCGGACTGG ATCTTGATTT GTGGGGTGTG 
CATCGCTCAG CGGTTGCCGC CGCCATTGGC GCGCATAATG CCGCGCTGGC AGAAACCGCA 
GCAGTAGAGC TATCGCTGGC CACGGGCGTA GCGCAGCTTT ATTACAGTAT GCAGGCCAGC 
TATCAGATGC TCGATCTGTT AGAACAAACT CACGATGTGA TTGATTACGC GGTGAAAGCG 
CACCAGAGTA AAGTGGCGCA CGGTCTGGAA GCGCAAGTGC CTTTCCACGG CGCGCGGGCA 
CAGATTCTGG CGGTCGATAA ACAAATTGTT GCCGTCAAAG GGCAAATCAC CGAAACGCGA 
GAATCTCTGC GTGCATTGAT TGGCGCGGGA GCCAGCGATA TGCCGGAGAT CAGACCGGTG 
GCATTACCGC AAGTCCAGAC CGGCATTCCG GCGACACTCT CTTATGAGTT GCTCGCCAGA 
CGCCCGGATC TGCAAGCCAT GCGCTGGTAT GTTCAGGCGT CATTAGATCA GGTGGATTCC 
GCGCGGGCGT TGTTCTATCC GAGCTTTGAT ATCAAAGCGT TTTTCGGTCT GGACTCCATC 
CATCTGCATA CCTTATTCAA AAAAACCAGT CGCCAGTTCA ACTTCATCCC GGGTCTGAAA 
TTGCCGCTGT TTGACGGTGG ACGGTTGAAT GCCAATCTCG AAGGCACGCG CGCCGCCAGC 
AACATGATGA TTGAACGTTA CAACCAGTCA GTACTGAACG CGGTGCGTGA CGTTGCCGTC 
AACGGCACGC GTCTGCAAAC GCTCAACGAC GAGCGAGAAA TGCAGGCTGA ACGCGTGGAA 
GCCACGCGCT TTACCCAGCG CGCTGCCGAG GCCGCCTATC AGCGCGGCTT AACCAGCCGC 
TTACAGGCCA CCGAAGCCCG GTTGCCAGTG CTTGCCGAAG AGATGTCATT ACTGATGCTG 
GACAGCCGCC GGGTGATCCA AAGCATTCAG TTGATGAAAT CGCTGGGCGG CGGGTATCAG 
GCAGGTCCCG TCGTCGAGAA AAAATAA

Protein sequence

MINRQLSRLL LCSILGSTTL ISGCALVRKD SAPHQQLKPE QIKLADDIHL ASSGWPQAQW 
WKQLNDPQLD ALIQRTLSGS HTLAEAKLRE EKAQSQADLL DAGSQLQVAA LGMLNRQRVS 
ANGFLSPYSM DAPALGMDGP YYTEATVGLF AGLDLDLWGV HRSAVAAAIG AHNAALAETA 
AVELSLATGV AQLYYSMQAS YQMLDLLEQT HDVIDYAVKA HQSKVAHGLE AQVPFHGARA 
QILAVDKQIV AVKGQITETR ESLRALIGAG ASDMPEIRPV ALPQVQTGIP ATLSYELLAR 
RPDLQAMRWY VQASLDQVDS ARALFYPSFD IKAFFGLDSI HLHTLFKKTS RQFNFIPGLK 
LPLFDGGRLN ANLEGTRAAS NMMIERYNQS VLNAVRDVAV NGTRLQTLND EREMQAERVE 
ATRFTQRAAE AAYQRGLTSR LQATEARLPV LAEEMSLLML DSRRVIQSIQ LMKSLGGGYQ 
AGPVVEKK