Gene Elen_0037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0037
Symbol
ID	8414316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	48378
End bp	49694
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	62%
IMG OID	645023012
Product	Coproporphyrinogen dehydrogenase
Protein accession	YP_003180420
Protein GI	257789814
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTTCAG AACGCTTGCT CACGTCCGTT GTTCGCGAAT GCACGAAGAA TTACCTGCGC 
CTCGAACCGA CGCAAGAGCG ACGCGTGCCC GGGCCGAAGC CCGGCCAGAA GTACATGCTG 
TACATGCACG TGCCGTTCTG CGAGCGGCTG TGCCCCTACT GCTCGTTCAA CCGCTTCCCG 
TTCGCGGAGG ATCGCGCGCG GCCCTACTTC GCCAACATGC GCAAGGAAAT GCTCATGTTG 
AAGGACCTCG GCTACGACTT CGAAAGCCTG TACGTGGGCG GCGGCACGCC CACCATCATG 
ATCGACGAGC TGTGCGACAC CATCGATATG GCGCGCGAGA CGTTCAGCAT CGGCGAGGTG 
TCCAGCGAGA CGAATCCGAA CCACCTGATT CCCAGCTACC TGGACAAACT GCAGGGCCGC 
GTGCAGCGTT TGAGCGTTGG CGTGCAGAGC TTCGACAACG ACCTGCTGAA GCAGATGGAT 
CGCTACGACA AGTACGGCAG CGGCGAGGAG ATCCTCGAGC GCATCGGCGA GGCCAGCCCC 
TACTTCACGT CGCTCAACGT GGACATGATC TTCAACTTCC CGGCGCAGAC CGAGGACGTG 
CTGTTCAGCG ACATCGAGCG CGTGGTGGAA AGCGGCACGA GCCAGACCAC GTTCTACCCG 
CTGATGGCCA GCCCCAGCGT GGCGCGCTCG CTGGCGCGCA CCGTGGGCAA GGTTGATTAC 
GCGCGCGAGC AGCGCTTCTA TGAGATCATC TCCGAAGTGC TGGCCGGCGG CGAGAACCCG 
CTGTTCGAGC ACGGCAGCGC CTGGACGTTC AACAAGCGCG GCACGGGCGC GGCAGGCGAG 
GACGCGATGA TCGACGAGTA CGTGGTGGAT TACGAGGAAT ACCCCGCCAT CGGCAGCGGC 
GGCATCACGT ATTTGGGCAA CAACCTGTAC GTGAACACGT TCTCGGTGAA CGACTACAAC 
GACGCCATCG AGCACGACCG CATGTCGCTG ATGGGCAAGG CCACGTTCAG CAAGCACGAC 
CAGATGCGCT ACCGCTTCAT GATGCAGCTG TTCGGATTGC GCCTGGACAA GCGCCAGTTC 
AAGAAGGACT TCGGCGTGTC CGTGGAGCGC GGTCTGCCGG TGGAGATGGC GTTCATGAAG 
GCCTCGGGCG CGTTCGACCG CGACAACGCC GACGAGCTGA CGCTTACGCC GAAGGGCCGC 
TACCTCATGG TGGTGATGAT GCGCCAATTC TTCATCGGCG TGAACAACCT GCGCGATCAG 
GCGCGCGCAG CCCTGGTGGG TGAGGAACGC GAGCTTATCT TCGGCGACGG CAAATAA

Protein sequence

MLSERLLTSV VRECTKNYLR LEPTQERRVP GPKPGQKYML YMHVPFCERL CPYCSFNRFP 
FAEDRARPYF ANMRKEMLML KDLGYDFESL YVGGGTPTIM IDELCDTIDM ARETFSIGEV 
SSETNPNHLI PSYLDKLQGR VQRLSVGVQS FDNDLLKQMD RYDKYGSGEE ILERIGEASP 
YFTSLNVDMI FNFPAQTEDV LFSDIERVVE SGTSQTTFYP LMASPSVARS LARTVGKVDY 
AREQRFYEII SEVLAGGENP LFEHGSAWTF NKRGTGAAGE DAMIDEYVVD YEEYPAIGSG 
GITYLGNNLY VNTFSVNDYN DAIEHDRMSL MGKATFSKHD QMRYRFMMQL FGLRLDKRQF 
KKDFGVSVER GLPVEMAFMK ASGAFDRDNA DELTLTPKGR YLMVVMMRQF FIGVNNLRDQ 
ARAALVGEER ELIFGDGK