Gene EcolC_2547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2547
Symbol
ID	6066277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2794422
End bp	2795648
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	52%
IMG OID	641601953
Product	drug efflux system protein MdtG
Protein accession	YP_001725505
Protein GI	170020551
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0112458
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.379099
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACCCT GTGAAAATGA CACCCCTATA AACTGGAAAC GAAACCTGAT CGTCGCCTGG 
CTAGGCTGTT TTCTTACCGG GGCCGCCTTC AGTCTGGTAA TGCCCTTCTT ACCCCTCTAC 
GTTGAGCAGC TTGGCGTTAC CGGTCACTCC GCCCTGAATA TGTGGTCCGG TATTGTCTTC 
AGCATTACAT TTTTATTTTC GGCCATCGCC TCACCGTTTT GGGGTGGACT CGCCGACCGT 
AAAGGCCGAA AACTCATGCT ATTACGCTCT GCTCTCGGCA TGGGCATCGT AATGGTGTTG 
ATGGGACTGG CACAAAATAT CTGGCAGTTT TTGATCCTAC GGGCGCTTCT TGGGTTACTT 
GGCGGATTTG TCCCCAACGC TAATGCTCTT ATCGCCACAC AAGTACCGCG TAATAAAAGC 
GGCTGGGCGC TGGGTACGCT CTCCACAGGC GGCGTTAGTG GTGCGTTGCT CGGCCCAATG 
GCTGGCGGCC TGCTCGCCGA TAGCTACGGC TTACGTCCGG TATTCTTTAT TACCGCCAGT 
GTGCTCATAC TCTGCTTTTT CGTCACCCTG TTTTGCATCA GAGAAAAATT CCAGCCGGTC 
AGCAAAAAAG AGATGCTGCA CATGCGGGAA GTGGTGACAT CACTTAAAAA CCCGAAACTG 
GTACTCAGCC TGTTTGTCAC TACGTTAATC ATCCAGGTGG CGACGGGCTC AATTGCCCCC 
ATTCTGACGC TGTATGTCCG CGAACTGGCG GGTAACGTCA GTAACGTCGC CTTTATCAGT 
GGCATGATCG CCTCGGTGCC AGGCGTGGCG GCTCTGCTAA GTGCACCACG ACTCGGCAAA 
CTTGGCGATC GAATCGGACC CGAAAAGATC CTGATTACAG CGCTGATCTT TTCTGTACTG 
CTGTTGATCC CAATGTCTTA CGTTCAGACG CCATTGCAAC TTGGGATTTT ACGTTTTTTG 
CTCGGTGCCG CCGATGGTGC ACTACTCCCC GCCGTACAGA CACTGTTGGT TTACAACTCG 
AGCAACCAGA TCGCCGGGCG TATCTTCAGC TATAACCAAT CGTTTCGTGA TATTGGCAAC 
GTTACCGGAC CATTGATGGG AGCAGCGATT TCAGCGAACT ACGGTTTCAG AGCGGTATTT 
CTCGTCACCG CTGGCGTAGT GTTATTCAAC GCAGTCTATT CATGGAACAG TCTACGTCGT 
CGTCGAATAC CCCAGGTATC GAACTGA

Protein sequence

MSPCENDTPI NWKRNLIVAW LGCFLTGAAF SLVMPFLPLY VEQLGVTGHS ALNMWSGIVF 
SITFLFSAIA SPFWGGLADR KGRKLMLLRS ALGMGIVMVL MGLAQNIWQF LILRALLGLL 
GGFVPNANAL IATQVPRNKS GWALGTLSTG GVSGALLGPM AGGLLADSYG LRPVFFITAS 
VLILCFFVTL FCIREKFQPV SKKEMLHMRE VVTSLKNPKL VLSLFVTTLI IQVATGSIAP 
ILTLYVRELA GNVSNVAFIS GMIASVPGVA ALLSAPRLGK LGDRIGPEKI LITALIFSVL 
LLIPMSYVQT PLQLGILRFL LGAADGALLP AVQTLLVYNS SNQIAGRIFS YNQSFRDIGN 
VTGPLMGAAI SANYGFRAVF LVTAGVVLFN AVYSWNSLRR RRIPQVSN