Gene Elen_1186 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1186
Symbol
ID	8415477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	1421984
End bp	1423237
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	70%
IMG OID	645024149
Product	major facilitator superfamily MFS_1
Protein accession	YP_003181545
Protein GI	257790939
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.790878
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACACCG AAAACCGCAC GAGCCGCAAG CGCAACGCGT TCGCAACCGC GTTGCTGACG 
ACCCTCGCGT TCGCACTCGG GTTCGCCGAG TTCGTGCTGA TAGGCATCGT GCCCGACGTA 
GCCGAAGGGC TGGGCGAGCC GCTCACGCTC ATCGGCGATC TCGTGGGCTA CTACGCGCTG 
GCCTGCGCCG TCGCCACGCC CGTCATAGCG CTCGCCACGG CGCGCGCCGC CCGTTTCAAG 
GTGATGGCGG CGCTGCTGGT GGTGTTCAAC GCCGGCAACC TGCTCACCCT GTTCGCCGAC 
GGCTACGCGC TGCTGCTCGT CTCGCGCGTG CTGCCCGCCG TCACGTCCGG CACGCTTCTG 
GCCCTCGCGC TCACCTACGT GCCCGACATC GTCGAGCCCA AGCGCGTTGC CGCGGTGCTG 
GGGCTCGTGC TTGCCGGTTT CTCGGTGTCG AGCGTCGTCG GCGTGCCCAT CGGCACGGCG 
CTGGCCGGCC TGTTCGACTG GAAGGCCGCC TACGCCTGCG TGTTCGCGCT CGGCCTCGCG 
GCGAGCGTCG TCCTGCTGCC GACGCTGCCC CGCACTCCCG CGCATACGGG AGACGCCGCC 
CCCACTCTCC GCTCGCAGCT GCGCCTGCTC GCCGACAGCC GCGTGCTGAC GAACATCGCC 
ATGATTCTCG CCGGCGTAGC GTCCACCTAC GTGTTCTACA CCTACCTCGC CCCTATCCTT 
GCCGACATCG CCGGCCTCGA CGCCGCAGGA TCGAGCTTCG TGCTGTTGCT GTTCGGCGCG 
GCATGCGTGG GATCGAACCT GCTGTCGGGC TGGATTGCCG GACGCTTCGG GCTGCGCGCG 
CTGCCCGTCG CCTTCGCCGC CCACGCGGCG CTTCTGGCCC TGCTGGCCGT GAGTCTGCCC 
GCAGGCGCTG TCGGTATCGC GAACATCCTC GCGGTGGGAT TGCTCATGTA CGTGATGAAC 
TCCACCGTGC AGATGCTGTT CCAGAGCGTC GCGCGCACCG ACTACCCCAG CGCGCTCACG 
TTCTCGGCGT CGCTGCATCC CATGTCGTTC AACACGGGCA TCGCGCTGGG CTCGTTCGCG 
GGCGGCCTCG TGATGAACGC GGGCGGGCTT CTGGCCACCG GCCCCGCAGG CGCGCTGTTC 
GCCCTGACCG CCGCCGCGTT GGCGCTGGCG CTCGTGCGCA TGACCGCGCG TCGCAGCGTC 
GAAATCGCCG CCGAGGCCGC CATCACTGCC GCGGCTGTCC GCGAGTCGAG GTAG

Protein sequence

MDTENRTSRK RNAFATALLT TLAFALGFAE FVLIGIVPDV AEGLGEPLTL IGDLVGYYAL 
ACAVATPVIA LATARAARFK VMAALLVVFN AGNLLTLFAD GYALLLVSRV LPAVTSGTLL 
ALALTYVPDI VEPKRVAAVL GLVLAGFSVS SVVGVPIGTA LAGLFDWKAA YACVFALGLA 
ASVVLLPTLP RTPAHTGDAA PTLRSQLRLL ADSRVLTNIA MILAGVASTY VFYTYLAPIL 
ADIAGLDAAG SSFVLLLFGA ACVGSNLLSG WIAGRFGLRA LPVAFAAHAA LLALLAVSLP 
AGAVGIANIL AVGLLMYVMN STVQMLFQSV ARTDYPSALT FSASLHPMSF NTGIALGSFA 
GGLVMNAGGL LATGPAGALF ALTAAALALA LVRMTARRSV EIAAEAAITA AAVRESR