Gene Elen_2885 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_2885
Symbol
ID	8417216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	3350028
End bp	3351302
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	65%
IMG OID	645025863
Product	major facilitator superfamily MFS_1
Protein accession	YP_003183219
Protein GI	257792613
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAACTG AAACAATGAA GGGCAGCAAC TACGCATGGG CGATCGCCGT CGCCTGCGTA 
GCCTTCTACG CCATCCCCTT GGGCGTCGTG GCGAACCAGG CCGGTTTGTT CGCATCGCCC 
GTCATGGAAG AGTTCGGCTG GTCGCGCACC GACGCGACGC TGTACATGTC CATCCAGCCG 
TGGGTGGCGG CTATCTGCAC GCCGTTCGCC GGCAAGCTCA TCTCCAGGTT CAACCCTCGC 
TGGGTGATGA CCGCCGCGGC CGCCGTCTTC GGCTTGGCTT CGCTGGCCTG TGCTTGGTTC 
ACCGAGCCGT GGCAGTGGAA CGTGTACGGC GTGCTGTACG GCGCGTCCGC CGCGTTCTGG 
ATGTACATCG CCACGCCGAC GTTCATCAAC CGTTGGTTCG CTAAGAGCAA CGGCACCGTC 
ATCGGCGTCA TCGGCGTGTG CGCGTCGCTG CTGGGCGCGT TCATGAGCCC GGTCATCCAG 
GGCTGGATCA GCGGCTACGG CTGGCACACC GCCCGTATCA TCATCAGCGT GATCGCGCTC 
GTCGCGTCCG TCGTGCTGAC CGCCGCGCTG CTGCGCGAGT CGCCCGAGAA GATGGGCGTG 
CTTCCCTGGG GCTACGGCGC CGCCGAAGTT GCGTCCGCGA AGTCCGAGGC CAAGTCCGTC 
ATCGACGTCG CCGCTGACGA AGGCGCCACG GCCGCGCAGG CTCGCAAGAA CCCGGCGCTG 
TGGCTGCTCA TCATCATGGC AGGCTTCTTC GTCATCGCCG CCGGCATGAT GCAGCAGTTC 
TCGTCCTATG CATCCACCGG CGCGCTGGGC GCGGCCGTGG GCGCCATGGG CGTGACCGTG 
TGCATGATCG GCCAGCTGTT CGGCAAGTTC GGTCTGGGTT GGCTGTGCGA CCACACGGGC 
GCCCGCGTCT CCGGCGTGGT CGCCAGCATC TTCGGCGCCG CCGGCATCGC CATCGTGCTG 
TTCAGCGTCG ATAACGCCAT GATGTTCTAC GTGGGCGTGT TCCTGTTCGG TATCGGCTTC 
GCCGCGCTCA ACATCGTGCC GCCTATGGCC TGCCGCCAGG CGTTCGGCCA GAAGGACTAC 
GCCAACATCT TCTCGATGGT GGCCACCGGC CTCAACGTGT TCTCCGGTTT CTCGGCGCTC 
ATCTACGCGC AGATCTTCGA CATCACCGGA TCGTTCGCCG GCTGCTTCTA CCTCATCATC 
GGCTTCTACG TGGTGACGCT CATCTGCTCG CTCGTGATCG TTCCCATGGG CCGTCGCTCC 
TGGGCGAAGA AGTAA

Protein sequence

MGTETMKGSN YAWAIAVACV AFYAIPLGVV ANQAGLFASP VMEEFGWSRT DATLYMSIQP 
WVAAICTPFA GKLISRFNPR WVMTAAAAVF GLASLACAWF TEPWQWNVYG VLYGASAAFW 
MYIATPTFIN RWFAKSNGTV IGVIGVCASL LGAFMSPVIQ GWISGYGWHT ARIIISVIAL 
VASVVLTAAL LRESPEKMGV LPWGYGAAEV ASAKSEAKSV IDVAADEGAT AAQARKNPAL 
WLLIIMAGFF VIAAGMMQQF SSYASTGALG AAVGAMGVTV CMIGQLFGKF GLGWLCDHTG 
ARVSGVVASI FGAAGIAIVL FSVDNAMMFY VGVFLFGIGF AALNIVPPMA CRQAFGQKDY 
ANIFSMVATG LNVFSGFSAL IYAQIFDITG SFAGCFYLII GFYVVTLICS LVIVPMGRRS 
WAKK