Gene Elen_2119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_2119
Symbol
ID	8416437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2493696
End bp	2495546
Gene Length	1851 bp
Protein Length	616 aa
Translation table	11
GC content	67%
IMG OID	645025102
Product	fumarate reductase/succinate dehydrogenase flavoprotein domain protein
Protein accession	YP_003182471
Protein GI	257791865
COG category	[C] Energy production and conversion
COG ID	[COG1053] Succinate dehydrogenase/fumarate reductase, flavoprotein subunit
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0348358
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.647949
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATACGT CTGCAACAAC CAATCATGGG GAATCGAACA ACGCGAACGG CGGCTTCTCG 
CGCAGGACGT TCGTCAAGGG CGGCTTGGCC GCCGGCGTCG CTGCGCTGGG CGGAATGGCG 
CTGACGGGAT GCGCCGCAGC ACCGGCTTCA TCGAAGCAGG CGGCTGCCGC CGACGCCGCC 
GCTCCGACCG ACGAGATCAC CGCGCGCCTG GTGGAGCGCG TGCACGACGC CAACCTGCCC 
GACGCGGCGC CCATCCTGCC GGTGGAGCCG CCGGCGTCGT GGGACGACGA GGCCGACGTG 
GTCATCGTCG GTGTGGGCGG CGGCGGTATC GTGGCCACGG CGTTTCTCGC CCAGCAGGGG 
CTCAAGGTCA TCGGCATCGA GAAAGAGGGC CAGGTGGGCG GTGCGAGCCG CCATGCCTGC 
ACGTTCGCCA ACGTGTTCGG CGGCTCGAAG GACCAGAACG CGCTGGAGTT CAGCGTGCCC 
ACGTTCCCGC CCGACGTGAA GGCGTTCACC CGCATGTACG AGGAGCAGAA CGCCTACTCC 
ATCGACGAGA AGTTCCTCAT GAACCAGCTG CTCATGTCCG GTCCCGCGTG CGACTGGATC 
ATGGAGCAAG ACGGCATGAA CATGGAATGC TTCGGGCCCA TCTGGCACGA CGCCGACGTC 
CACGCCGGCA AGCAGAGCGT GGTGCTGGGC ATGAACAACC CCACGAACGC CATGGAAGCC 
GTTGCGCTGG CAGCGGGCGC CGACATCCGC CTGTCCACGA AGTGCGAGAA GCTCGTGGCT 
GACGGCGGTC GCGTGGTGGG CGTCGTGGCC AAGGGGCCGG ATGGCAAGGA GCGCTACGTC 
AAGGCCGAGA AGGGCGTCAT CCTGTGCGCG GGCGGCTTCG GCATGAACCG CGACCTGATC 
CGCGCCTACC TGCCGAGCGC CTACGAGGGC ACCGTGCAAG GCGGTCCCAT GCCGTCGCAT 
ACGGGCGAAG CCTTCCGCAT GGGTCTGGGC ATGGGCGCCG ACTTCTCCGG CTTCGATTCG 
TGGAGCTGTT GGGAAGGCGC CATCGACGAG GAGACGGCCG GCGGCGACGG CCAGTTCTGG 
CACTATTTCT GGCACGGCGA GCGCCAGCTG TTCCACAACC CGTGGCTCAT CATCGACAAG 
CGGGGCAACC GCCAGCCGTA CTTCGCAGCC ACGCAGGAGC TGTTCGCGAA CCCGGGCGGG 
CAGATGGGCG ACCTGAGCAA CTGCGCGGCC TGGATGTCGG CGGTGGGACA TCATGTGTAC 
TCCATCTGCG ACTCCGACTT CCCGACCACC GTGTTCGAGA AGAACGTGCT CACCGACGAG 
GGCACCGACC GCAACCGCAT TCCCATCACC GACCCGAGCA CGCTGATCGA CACGAAGGGC 
CTCGTGTCGG CAGACTGGCT GGCCGAGGTC GACGAGGCGG TGGAGCGCGG CGCCGTGAAG 
AAGGCCGACA CCATCGAGGA GCTGGCCGAT ATGCTGCTGC TCGACCGCGA CGTGCTGGTG 
CGCGCGGTGA AAGAGTACAA CGAGCTGTGC GAGAAGGGCG TGGATGACGA GATGTCCACG 
CCGTACGACC CCTCGTGGCT GCATCCCGTG GTGAAGCCGC CGTTCTACGG GGCCATCATC 
GGCAGCCAGA TGGCGAAGAC GATGTGCGGC CTGCGCACCG ACGAGCATCT GCAGGTCATG 
CGCGAGGACG GCTCGCTCAT CGAGGGTTTG TACGCCAACG CCACCACGGC GGGCGGCCTG 
TCGGGCGAGG CGAACTACGG CTGCTTCTGG AACTCGACGG TGTTCGGCGG GGTGGGCACC 
AGTTGGATCA CCGGGTGGAT CGCGGCGAAG TCGCTGTTGG ACGCCCAGTA G

Protein sequence

MDTSATTNHG ESNNANGGFS RRTFVKGGLA AGVAALGGMA LTGCAAAPAS SKQAAAADAA 
APTDEITARL VERVHDANLP DAAPILPVEP PASWDDEADV VIVGVGGGGI VATAFLAQQG 
LKVIGIEKEG QVGGASRHAC TFANVFGGSK DQNALEFSVP TFPPDVKAFT RMYEEQNAYS 
IDEKFLMNQL LMSGPACDWI MEQDGMNMEC FGPIWHDADV HAGKQSVVLG MNNPTNAMEA 
VALAAGADIR LSTKCEKLVA DGGRVVGVVA KGPDGKERYV KAEKGVILCA GGFGMNRDLI 
RAYLPSAYEG TVQGGPMPSH TGEAFRMGLG MGADFSGFDS WSCWEGAIDE ETAGGDGQFW 
HYFWHGERQL FHNPWLIIDK RGNRQPYFAA TQELFANPGG QMGDLSNCAA WMSAVGHHVY 
SICDSDFPTT VFEKNVLTDE GTDRNRIPIT DPSTLIDTKG LVSADWLAEV DEAVERGAVK 
KADTIEELAD MLLLDRDVLV RAVKEYNELC EKGVDDEMST PYDPSWLHPV VKPPFYGAII 
GSQMAKTMCG LRTDEHLQVM REDGSLIEGL YANATTAGGL SGEANYGCFW NSTVFGGVGT 
SWITGWIAAK SLLDAQ