Gene Elen_2302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_2302
Symbol
ID	8416626
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	2705684
End bp	2706919
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	72%
IMG OID	645025287
Product	major facilitator superfamily MFS_1
Protein accession	YP_003182650
Protein GI	257792044
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAA GCCTGCTCGC CCTCGCCACC GGATCGTTCG CGCTCGGATT CGCCGAGTTC 
GTGATGATGG GCATCCTCCC CGTCACGGCC TCCGGCCTGT ACGTCAGCGT GCCGGCGGCC 
GGCACCTTCA TCTCCGCATA CGCCCTCGGC GTGTGCGTGG GCACCCTGTT CCTCGTGTTC 
GGCCGACGCG TGCCGCCCAA GCGGCTGCTG CTCGGGTTCG TGGCGCTCGT GGCGCTCGGC 
AACGCCGCGG CCGCCCTCGC ACCGAACGCC GAGGTGCTCG TGGCGGCGCG CTTCGTGTCC 
GGCCTGCCAC ACGGCGCGTT CTTCGGCACC GCCACCATCG TGGCGCGCGA GCTAGCCGAA 
CCCGGCCGCG AGGGTCAGGC CGTGTCCATC ATGGTGCTGG GACAGACGGT GGCGAACATG 
GTGGGCGTGC CTGGCGGCAC GCTGCTGGCC GGCCTCGTGT CGTGGCGCGC GGCGTTCGTG 
TTCGTCGCCG TGTGGGCGCT CGGCTCGTTT GCGCTCGTCG CGCGCCTCGT GCCCGCCGTG 
CGCCCCATCC CCGACGCGGG CTTGGCGGGC CAGTTCCGCT TCCTCAAGAA GCCGGGCCCC 
TGGCTGGTCA TCGGCGCGGT GCTGCTGGGC AACACCGGCG TGTTCTGCTG GTGGAGCTAC 
GTGTCGCCGT GGCTGACGGA CATCGGCGGC TTCCCGTCCG ACGCGCTGCC GGCGCTGCTC 
GCGCTGGCGG GCTTCGGCAT GGTGGTCGGC TCGCTCGTGG GCGGCCGGCT CACCGACCGC 
ACGTCGCCCG GCAAGATGGC GGCGGCCGGC CAGGCCATCG GCTGCATCAC GCTCGCGCTC 
ATCTTCGCGT TCTCGGGCGC GCCCGCCACG GCGGCCGGGC TCATGTTCCT GTGCGCCTTC 
GGCATGTTCT TCGTGTCGAG CCCCCAGCAG CTGCTCATGG TGAAGGTGGG GCGCGGCGGC 
GGCGAGATGA TCGGGTCGGC GTGCGTGCAG GTGGCGTTCA ACCTGGGCAA CGCGTTCGGC 
GCCACCATCG GCCAGGCCGT GCTCAACGCC GGAGCGTCCT ACGCCTCGCC GAGCCTGGCG 
GGCGTGCCCT TCTCGCTTGC GGCCGTCGCG CTGCTCGCGG TGTTCGCCGC CCGCTACGAG 
CGCCGCTACC GCGCAGCCGG CGCGCCGGAC GGCATCGACG TGCACGACGC CCCGGAAACG 
CCGTCGTGCA CGCAGCCCGC TTTTCGCCTA GAATGA

Protein sequence

MKKSLLALAT GSFALGFAEF VMMGILPVTA SGLYVSVPAA GTFISAYALG VCVGTLFLVF 
GRRVPPKRLL LGFVALVALG NAAAALAPNA EVLVAARFVS GLPHGAFFGT ATIVARELAE 
PGREGQAVSI MVLGQTVANM VGVPGGTLLA GLVSWRAAFV FVAVWALGSF ALVARLVPAV 
RPIPDAGLAG QFRFLKKPGP WLVIGAVLLG NTGVFCWWSY VSPWLTDIGG FPSDALPALL 
ALAGFGMVVG SLVGGRLTDR TSPGKMAAAG QAIGCITLAL IFAFSGAPAT AAGLMFLCAF 
GMFFVSSPQQ LLMVKVGRGG GEMIGSACVQ VAFNLGNAFG ATIGQAVLNA GASYASPSLA 
GVPFSLAAVA LLAVFAARYE RRYRAAGAPD GIDVHDAPET PSCTQPAFRL E