Gene Elen_0131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0131
Symbol
ID	8414415
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	178059
End bp	180176
Gene Length	2118 bp
Protein Length	705 aa
Translation table	11
GC content	65%
IMG OID	645023111
Product	hypothetical protein
Protein accession	YP_003180514
Protein GI	257789908
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCGCA CGAGGTCACG CTCGAACGGC ATCGTCGCGA TCGCAATCGC TTTCGCGCTC 
GCTGCAAGCA ATCTCGCCTT CGCGCCTCAG CCCGCGCATG CGCAACCCGA GGCGAACGAA 
GTCGTCATCG TGCAGAACAT GACGCCCATC GGCAGCGCCG AGGAATACGA CGCGCTGTTC 
CCGTCCGGCT ACCCGAGTGC CGACAAGCCC CTTTCGGCCG GAAATGAAGG CGAATCGACC 
GACGAGGGCG CAACCGGGGA AACGCCCCTT TGCGGCGCGC GCTCTTTTGC GCCAAGCGAT 
GCCGAGACGA TGTCCTCGCT GAAGCAGCAG ATCGCCGCTG ACGAACCTCG CATCACGACT 
GCCGAGAAAA CCGATTACCA GGTAGGCGAT TCGAAGACGT TTCGCGCCGC AGGCCGTCCG 
GAAGGATTCA CGGCCACGGC AGTGGCTGTC GGAGAGCTGT TCACCCTGTG GGTCGAGGAC 
GCGGAGTCCG ACATGCTCCC CGCAGATCTG GTGCAAAGGC TGGCTGGCAA GATCGACCCC 
GTTCTTCGAA AAGTAACGGA CGCCTTCGGG TCGACGGTTC GCGTCGATTT GGACGGCGAC 
GGGAAAACCG CGTTCGTCTT CCACCGATTC CCGCCGGAGA CGGAGGTGCT GGACGGCTAT 
TTCACCTCGA TCGACTTGTA CACACCCGAG CAGCTGACGG CTGCAGACCT GATCGAAGAG 
GCCTCCTACA CCAACGCTAT GGACGTGCTG CACCTCAACG TGCTGAACCG AAAGTCGTTG 
GAGGGCGTGG GCGAGTTCGA CGAGAGCCTC GTCCCGCCGA TGATCGCCCA CGAATTCCAG 
CACCTGGTGA ACTTCGCGCA GACAGACGGC TCCAGCGAAG CATGGCTCAA CGAGGCGTTC 
TCCCAAGCGG CCGTGGCCAT CGCAGGATAC GGCTCCACCC AGAAAACCCG AGCTCAGAAC 
TTGGCCGTGA TGGTCAACCT CAGCGGCCGC ATTCCCCCGT TCGTATACGA GGGGAGCTTC 
GTGCCGGACG CTTCTCTGGG CGCAGGAGGA ACAGCGGTGT ACGCGCACGG TTACCTGTTC 
TCGCGCTATC TCGCCAACCA AACCCGCGGG CTTCCCGGAG GCGGAGACAG CGTGTACCGA 
TCGGTGTTCG ACGCGATGCG GGACGAGCGA GGGCTGGGTC AGTGCACGTC GGAGAGCCTG 
ATGGCCGCAC TCGACAACAT CGGGTACGCG GGCGTCGGCG ACGACTGCGC CGTGGCCAGC 
CTGGACGACC TTGCCCTCGG TTACGCGACG GCGCTTTTCC TGCGCGAGGA AACGGGCCCG 
CACAGCTTGG TGAACCGCGC AGGATCCAAT CCGTCCATCG TGGACGGGTT GGAAGTTCCC 
CTGCTTTCCG TGCCGGAACC CTCCAAGTCG CTGCAAGGAG GCGGCTCGGC GACGATAGCC 
TCACTGGCAG CCTCGGGAGC GCCGGGTGCG AACGCCGGGT CCGGCACCCA AACGAAGTTC 
GCCACCTCTT CGCTGCCTGT TTCCTATAAG ATAGCGGCAA ACCCGTCGAG CGGACCGGTG 
AAGCCGGGAA GCCAGATCGC ACTGAGCTCG CCTCAGCTGG CAAGCCTCCC CGGCGCGCAT 
TACGAGGTTG CGACCCTCAC CACCTACGAG CAGATCCTCA ACTTGAGCGC GCCCTTCCTG 
CCGCTGGAAG ACCCGCTGCT GTTCGAGCCG GGCGTTTTGG CGTACGCGGT ACGCATCGCA 
AGCGACCGCG GAACGACGCC CCACACCGTA TTCGGCTTTT ACGAAACCGC CGAACCAGAC 
GAGGGCGAAG GCGACCAGGG CAACGATCCG TCCGGCGGCA CTCCCCCGTC GGACGATGCC 
GGAGACGCGC CTTCCGGCGG GGATCAGCCT TCGGGGGGCA GCCCCTCAAG CGACGGCGCG 
CAGCATCCCG GCAGCGCGCC CGATGACAAC GGCACCGACG ACGCGCGGAT CCGCCAGATG 
CCCGCAAAAG CGCTCGCCGC CACCGGCGAT GGAGAGGCAC CGATCGCCGC CCTCGCACTG 
GCAGCCGCGG CAAGCCTGTG CTGCATGGCG CTCGCACGAT GCGCGAAGAA ACGGAGCGTC 
GGCTCCCCAG CAAGGTGA

Protein sequence

MLRTRSRSNG IVAIAIAFAL AASNLAFAPQ PAHAQPEANE VVIVQNMTPI GSAEEYDALF 
PSGYPSADKP LSAGNEGEST DEGATGETPL CGARSFAPSD AETMSSLKQQ IAADEPRITT 
AEKTDYQVGD SKTFRAAGRP EGFTATAVAV GELFTLWVED AESDMLPADL VQRLAGKIDP 
VLRKVTDAFG STVRVDLDGD GKTAFVFHRF PPETEVLDGY FTSIDLYTPE QLTAADLIEE 
ASYTNAMDVL HLNVLNRKSL EGVGEFDESL VPPMIAHEFQ HLVNFAQTDG SSEAWLNEAF 
SQAAVAIAGY GSTQKTRAQN LAVMVNLSGR IPPFVYEGSF VPDASLGAGG TAVYAHGYLF 
SRYLANQTRG LPGGGDSVYR SVFDAMRDER GLGQCTSESL MAALDNIGYA GVGDDCAVAS 
LDDLALGYAT ALFLREETGP HSLVNRAGSN PSIVDGLEVP LLSVPEPSKS LQGGGSATIA 
SLAASGAPGA NAGSGTQTKF ATSSLPVSYK IAANPSSGPV KPGSQIALSS PQLASLPGAH 
YEVATLTTYE QILNLSAPFL PLEDPLLFEP GVLAYAVRIA SDRGTTPHTV FGFYETAEPD 
EGEGDQGNDP SGGTPPSDDA GDAPSGGDQP SGGSPSSDGA QHPGSAPDDN GTDDARIRQM 
PAKALAATGD GEAPIAALAL AAAASLCCMA LARCAKKRSV GSPAR