Gene Emin_0414 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0414
Symbol
ID	6262550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	445061
End bp	446482
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	43%
IMG OID	642610882
Product	major facilitator transporter
Protein accession	YP_001875308
Protein GI	187250826
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.444257
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGGCGC TAGACAGTGT GGCCGGCCGG TTGCGCGGGT CCAAAAAAGT AATCGCGTGG 
CTTGTGGCGG TAGCTTTTTT TATGCAGATG TTAGACGGTA CTATTCTAAA TACAGCTCTT 
CCAGAAATAG CCAAATCGTT TGGCGAAAAC CCTTTAAGAA TGCAGTCTGT TGTAATATCC 
TATATGCTTA CCGTGGCGTT TATTTTGCCC ATATCCGGCT GGCTGGCGGA TTTTCTTGGC 
ACTAAAAGGG TTTTTATAAG CGCTATTTTT ATTTTCAGTT TAGGTTCTCT TTGCTGTGCT 
TTGTCAAACA CTCTTACGCA GTTGGTGCTC TCGCGCGTTT TGCAAGGCGT GGGCGGCGCT 
TTAATGGTGC CCGTGGGCAG GCTTGCCGTA ATGAGGATAT TTCCTAAAAA AGAACTTGTT 
TCGGCTTTAA GTTTTATCAC AATACCTGCT CTTGTAGGGC CTATTGTCGG GCCTTTCGCG 
GGTGGTGTTA TTGTGCAGTA TGTTTCCTGG CATTGGATTT TTTTAATTAA TCTGCCCATA 
GGCGTTGTTT GCGCCGTATT TACTTATATA GCTATGCCTA AAGTAACGCC CGTTAAATTT 
AAATTTGACT GGATAGGCTA CCTTTTATTT AGCGCGGCTG TTATACTTAT ATCACTTTCA 
TTAGGAAGTG TTGATGAGGC TACGCTCGGC CGCAGGGCCG CGGTATTAAT GTTTTTAGCC 
GGAGCTTTAT GCCTTGGCGC TTACGCAAGG CTTTCAATAG CCAAACCATG GAGCGCTTTA 
TTTAAACCAA GGCTTTTTTA TGAACGCAGT TTTACCGTGG GTATAATAGC TAATTTATTT 
ATACGCTTTG CCGGCGGCAG TTTGCCTTTT TTAGCTCCTT TATTTTTGCA AACGGCCTTA 
AATTATTCCC CTTTAAAAGC GGGTGTGGCA ATGCTTCCTT TAGGCGTAAT GTCCATAGCC 
GCTAAGACTT TTGTGGAACC AGTGTTAAAC AAGTTAGGAT ACAGGCGTTT AATGACTTAT 
AACGCTATAA TCATAGGTAT TATGCTTTGT TTTCTTGCGT TCATAGGGCC AAATACAAGC 
TATTTGTTTA TTTTGGTTTA TTTGGGCGTG CTAGGCATAT TCAACTCTAT GCAGTTTACC 
TCTTTAAACA CTCTTACGCT TATTGCGGTT CCGCCAAGGG ATTTAAGCCA GGCTAACAGC 
CTGCTTTCGG CTGTTATGCA AATTTCAATG GGACTGGGCG TATCTTTAGT TTCGGCCGCG 
CTTGCTTATT TCGGTGCGCA TACGGCTAAA ATAGGGTCTG AAAATATACT TTATTCCTTC 
CACGCCACAT TTGTTTTTAT AGGCGTTATT TCAATACTGG GGGTAATTTT ATTTCAAAGC 
AAATTTGCCC GGGGTATAGT AGATAAGCCT AAAAACATGT AA

Protein sequence

MLALDSVAGR LRGSKKVIAW LVAVAFFMQM LDGTILNTAL PEIAKSFGEN PLRMQSVVIS 
YMLTVAFILP ISGWLADFLG TKRVFISAIF IFSLGSLCCA LSNTLTQLVL SRVLQGVGGA 
LMVPVGRLAV MRIFPKKELV SALSFITIPA LVGPIVGPFA GGVIVQYVSW HWIFLINLPI 
GVVCAVFTYI AMPKVTPVKF KFDWIGYLLF SAAVILISLS LGSVDEATLG RRAAVLMFLA 
GALCLGAYAR LSIAKPWSAL FKPRLFYERS FTVGIIANLF IRFAGGSLPF LAPLFLQTAL 
NYSPLKAGVA MLPLGVMSIA AKTFVEPVLN KLGYRRLMTY NAIIIGIMLC FLAFIGPNTS 
YLFILVYLGV LGIFNSMQFT SLNTLTLIAV PPRDLSQANS LLSAVMQISM GLGVSLVSAA 
LAYFGAHTAK IGSENILYSF HATFVFIGVI SILGVILFQS KFARGIVDKP KNM