Gene EcHS_A1175 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1175
Symbol	mdtG
ID	5595064
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1177937
End bp	1179166
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	52%
IMG OID	640920334
Product	drug efflux system protein MdtG
Protein accession	YP_001457897
Protein GI	157160579
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	0.504278
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACCCT GTGAAAATGA CACCCCTATA AACTGGAAAC GAAACCTGAT CGTCGCCTGG 
CTAGGCTGTT TTCTTACCGG GGCCGCCTTC AGTCTGGTAA TGCCCTTCTT ACCCCTCTAC 
GTTGAGCAGC TTGGCGTTAC CGGTCACTCC GCCCTGAATA TGTGGTCCGG TATTGTCTTC 
AGCATTACAT TTTTATTTTC GGCCATCGCC TCACCGTTTT GGGGTGGACT CGCCGACCGT 
AAAGGCCGAA AACTCATGCT ATTACGCTCT GCTCTCGGCA TGGGCATCGT AATGGTGTTG 
ATGGGACTGG CACAAAATAT CTGGCAGTTT TTGATCCTAC GGGCGCTTCT TGGGTTACTT 
GGCGGATTTG TCCCCAACGC TAATGCTCTT ATCGCCACAC AAGTACCGCG TAATAAAAGC 
GGCTGGGCGC TGGGTACGCT CTCCACAGGC GGCGTTAGTG GTGCGTTGCT CGGCCCAATG 
GCTGGCGGCC TGCTCGCCGA TAGCTACGGC TTACGTCCGG TATTCTTTAT TACCGCCAGT 
GTGCTCATAC TCTGCTTTTT CGTCACCCTG TTTTGCATCA GAGAAAAATT CCAGCCGGTC 
AGCAAAAAAG AGATGCTGCA CATGCGGGAA GTGGTGACAT CACTTAAAAA CCCGAAACTG 
GTACTCAGCC TGTTTGTCAC TACGTTAATC ATCCAGGTGG CGACGGGCTC AATTGCCCCC 
ATTCTGACGC TGTATGTCCG CGAACTGGCG GGTAACGTCA GTAACGTCGC CTTTATCAGT 
GGCATGATCG CCTCGGTGCC AGGCGTGGCG GCTCTGCTGC TAAGTGCACC ACGACTCGGC 
AAACTTGGCG ATCGAATCGG ACCCGAAAAG ATCCTGATTA CAGCGCTGAT CTTTTCTGTA 
CTGCTGTTGA TCCCAATGTC TTACGTTCAG ACGCCATTGC AACTTGGGAT TTTACGTTTT 
TTGCTCGGTG CCGCCGATGG TGCACTACTC CCCGCCGTAC AGACACTGTT GGTTTACAAC 
TCGAGCAACC AGATCGCCGG GCGTATCTTC AGCTATAACC AATCGTTTCG TGATATTGGC 
AACGTTACCG GACCATTGAT GGGAGCAGCG ATTTCAGCGA ACTACGGTTT CAGAGCGGTA 
TTTCTCGTCA CCGCTGGCGT AGTGTTATTC AACGCAGTCT ATTCATGGAA CAGTCTACGT 
CGTCGTCGAA TACCCCAGGT ATCGAACTGA

Protein sequence

MSPCENDTPI NWKRNLIVAW LGCFLTGAAF SLVMPFLPLY VEQLGVTGHS ALNMWSGIVF 
SITFLFSAIA SPFWGGLADR KGRKLMLLRS ALGMGIVMVL MGLAQNIWQF LILRALLGLL 
GGFVPNANAL IATQVPRNKS GWALGTLSTG GVSGALLGPM AGGLLADSYG LRPVFFITAS 
VLILCFFVTL FCIREKFQPV SKKEMLHMRE VVTSLKNPKL VLSLFVTTLI IQVATGSIAP 
ILTLYVRELA GNVSNVAFIS GMIASVPGVA ALLLSAPRLG KLGDRIGPEK ILITALIFSV 
LLLIPMSYVQ TPLQLGILRF LLGAADGALL PAVQTLLVYN SSNQIAGRIF SYNQSFRDIG 
NVTGPLMGAA ISANYGFRAV FLVTAGVVLF NAVYSWNSLR RRRIPQVSN