Gene Elen_1836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1836
Symbol
ID	8416140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2158119
End bp	2159435
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	63%
IMG OID	645024806
Product	major facilitator superfamily MFS_1
Protein accession	YP_003182189
Protein GI	257791583
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATTGC TTGCCAAGAG CAAGGGAGAG GTTACCTACA AGGAGCTCTC CACCCTGCAC 
AAGTGGGCGC TCGTCGTGCT CATCTCCATG GGCTCGTCGA TCATCTACGC GCCGATGTAT 
CTGAAGAACG TCTTCTACGA TCCGCTGATG CAAGCGCTCG GCGCCACCAA CGCCGACCTC 
GGCCTCATGG TGTCGGCCTA CGGCATCGCC GCCATGATCT GCTACCTGCC CTCCGGCATC 
GTGGCCGACA AGTTCCGCAT GCGCACGCTG GCATGGGTCG GCTTCATCGC CACCGCCGTG 
CTCGTGTTCG TGTACGCCAT GCTGCCTTCC GTGCAGATCT GCCTGATCCT GTTCGTGCTC 
ATGGGCGTCA CCTCCATCCT CGTGTGGTGG GGCACGCGCT TCAAGGTCAT CCGCCTGTGC 
TGCGAGGAGA ACGAGTACGC CTCCAAGATC GGCATCAGCT ACTCCATCTA CGGCGTCACC 
GGCCTCGTCA TCGGCCTCAT CAACGCCGGC ATCATCGCGG CCATCTCCGG CTCCGCGGGC 
GTGCAGGCCA TGCTCATCTT CCTGGGCGTC GTCATCGCCG TCCTGGGCGT CGTCTCCTTC 
TTCATCATCC CCGACTTCAA GGGCGAGATC AATAAGGACG CCAAGCTGTT CAGCGTCAAG 
GAGGCCATCC AGGCCATCAA GCACCCCGGC GTCATCTGGG CCTGCGTCGC GTACTTCGCC 
TGCTACGCCG TGTACCAGGG CGCTACCTAC ACCACGCCGT ACCTCACGCA GTGCTTCAAC 
GCCGACGGCA ACCTCGTGAA CATCGTCGGC CTCATCCGCA CCTACGGCAT CGGCCTCATC 
GCCGGCCCCA TTGTCGGCTT CATCGCCACG AAGATCAAGA GCCCCTCGAA GACCATCCTG 
GGCGGCTTCA TCCTGTCCAT CGCGGTACTC GTCGGCTTCA TCCTGTTCCC GCAGGATCCC 
TCCGGCGCCA TGGTCGCCTC CATCCTCGTG GTCGTGTTCG GCTTCACCAC CTACGGCGCC 
TTCTCCATCG GCTCCTCGCC GCTGTCCGAG GTCAAGATCC CCATGGCCAT CTTCGGCACC 
GCCTCCGGCC TGCTGTCCGT CATCGGCTTC CTGCCTGACG TGTTCATCCA CACCTGGTAC 
GGCGGCATGA TCGACGCCCA GGGTACGGCA GCGTTCTCCA GCATCTTCGG CTTCGAGATC 
ATGTTCGGCG TCATCGGCTG CATCGCGCTG GTCATGCTGC TCCGCTCCAT CAAGAAGCAC 
TTCGGCGCCT CCGACGCGGT CGCGGCCGCA GAGGACGGCG AGTCCGCCAA GGCGTAA

Protein sequence

MSLLAKSKGE VTYKELSTLH KWALVVLISM GSSIIYAPMY LKNVFYDPLM QALGATNADL 
GLMVSAYGIA AMICYLPSGI VADKFRMRTL AWVGFIATAV LVFVYAMLPS VQICLILFVL 
MGVTSILVWW GTRFKVIRLC CEENEYASKI GISYSIYGVT GLVIGLINAG IIAAISGSAG 
VQAMLIFLGV VIAVLGVVSF FIIPDFKGEI NKDAKLFSVK EAIQAIKHPG VIWACVAYFA 
CYAVYQGATY TTPYLTQCFN ADGNLVNIVG LIRTYGIGLI AGPIVGFIAT KIKSPSKTIL 
GGFILSIAVL VGFILFPQDP SGAMVASILV VVFGFTTYGA FSIGSSPLSE VKIPMAIFGT 
ASGLLSVIGF LPDVFIHTWY GGMIDAQGTA AFSSIFGFEI MFGVIGCIAL VMLLRSIKKH 
FGASDAVAAA EDGESAKA