Gene Elen_1856 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1856
Symbol
ID	8416160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2182247
End bp	2184307
Gene Length	2061 bp
Protein Length	686 aa
Translation table	11
GC content	70%
IMG OID	645024826
Product	protein of unknown function DUF224 cysteine-rich region domain protein
Protein accession	YP_003182209
Protein GI	257791603
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCGG CGACGCCTTC GCGCGAGGCG CTGTGGAACA TCGAGGGGTC GTGGCTCGTG 
TACCCCTGCT TCCTGTTGGT GCTGGTCGTC GCCGCGTACT TCTTCTGGCG GCGCTACCGC 
CTGTGGAAGA TCGGCCGACC GCTTGAGCGC GGCGATCGCC CGCTCGAGCG CTTGAAGGGC 
GCGTTCGTGG ACGCGCTCTT GCAGGTCACC GTCGTGAAGG AGCGGGGCGT CGGCATCGCG 
CACCTCGGGA TGTACGTGGG CATGGCCGTC ATGGTGGTGG CCACGGCGAG CTATGCGGTG 
CAGGTGGACC TGGGGCTCGA CATCGCCAAG GGCGACTACT ACCTGTACGT GCTGGCGCTC 
GGCACCGATA TCGCGGGGTT GGCGTTCTGC ATCGCGATGG TCGCCTGCAT CGTGCGGCGG 
GCGGCCGGCA GGAACCCGTC GCTCGAGACG AAGCCGGCCG ACATCGTTGT GCTGGCATGG 
CTGCTGGTCA TCGGCGTCAC GGGCTTCGTC GTGGAGGGGC TGCGCATCGT GGGTACGAAC 
GATCCGTGGG CCGCGTGGTC GCCCATCGGC AATCTGTTCG CGCCGCTGTT CGCAGGCTTG 
AGCGCCGCCC AGGTGTCGAC GGCGCACCAG GTTCTATGGT GGTTCCATAT GGCCATCGCC 
TTCGGGATCC TGGCGTACTG GATGTACTCG AAGCTCGTGC ACGTGCTGCT GGTCCCGGCC 
ACCGTGTACT GCCGTCCGCT TGAGCCGAAG GGGACGCTGT CCTACGTCGA CCTCGAGGAC 
GAGGAGCTGG AAGAGTTCGG CGTGGGAAAG CTGGAGGACT TCACATGGAA GGACCTGCTG 
GACGCCGAGG CGTGCGTGCG CTGCGGCCGC TGCGAAACGG TGTGCCCTGC GCACGGAAGC 
GGCAAGCCGC TGTCGCCGAA GGACCTGATG CAGGCGCTCG ACGCCCATCT GGGGGAGCGC 
GGGCCGCTCG TGCGCGCCGA GCGTCGGGCC GAAGCGGCGG GCGAAGCGTT CGAGCCGACC 
GAGGAGCAGC GGGCCGTGCT GGACAAGGCG CTCGTGGGCG ACGTGGTCGC GCCCGAGGCG 
CTGTGGTCGT GCACTACGTG CGGCGCGTGC ATGGAGGCGT GCCCGGCGCT GCTGGAGCAC 
GTGCCGAAGG TGGTGGGCAT GCGCACCTAC CAGGTGTCGA TGGAAAGCGC GTTCCCGTCG 
GAGGCTAAGG CGGCCTTCCG CAACCTCGAG ACGAACGGCA ACCCGTGGGG CTTGGGGTGG 
CAGAGCCGCA TGGCATGGGC GGAGGGGCTC GACGTGCCCA CGCTGGCCGA CCGTCCGCAG 
GCGGAGTACG TGTACTGGCC TGGCTGCTCG GGAGCGTACG ACGCGCGCAA CCGCAAGGTG 
TCGCGCGCCC TCGTGGCGCT GCTGAGGCAT GCGGGCGTGG ACTTCGCCGT CATCGGCCCG 
GAGGAGAAGT GCTGCGGCGA CGCGGCGCGG CGCATGGGCA ACGAGTTTCT GTACTACCAG 
CTTGCCACCG AGAACATCGA GACGCTGAAC GCCTACGGCG CGAAGAAGAT CATCGTGCAG 
TGCCCGCACT GCGCCCAGGC GCTGGAGCGC GATTACCCGC AGCTTGGCGG CCGGTTCGAA 
GTGGTGCGGC ACGCGCAGCT GCTCGAGAGG CTCGTGGCCG AAGGGAGGCT GCCGGGCGCG 
GAGCGGGCGG GCGCGCAGGC GGCGTTCGAG CGCGTCACGT ACCACGACTC GTGCTACCTG 
GGACGCTACG CCGACGTGTA CGACGAGCCG CGTGCGGTGG TGAAGGCGTG CGGCGCCCAG 
GTGGTGGAGA TGGAGCGGAC GCGCGAGAAG AGCTTCTGCT GCGGCGCGGG CGGCGGGCGC 
ATGTGGCTCG AGGAGCGCGA GGGGCGGCGC ATGAACGTCC TGCGCGCCGA GCAGGCGCGC 
GACACCGGTG CGGACGCCGT GGCCACCGCC TGCCCGTTCT GCCTGTCCAT GCTGGAAGAC 
GGCCTGGCGT CCCAGGACGA TGCCCTGCCG GTACGGGACA TCGCCGAGCT GTTGTCCGAC 
GCGCTGGCTC TGTCGCGGTG A

Protein sequence

MDAATPSREA LWNIEGSWLV YPCFLLVLVV AAYFFWRRYR LWKIGRPLER GDRPLERLKG 
AFVDALLQVT VVKERGVGIA HLGMYVGMAV MVVATASYAV QVDLGLDIAK GDYYLYVLAL 
GTDIAGLAFC IAMVACIVRR AAGRNPSLET KPADIVVLAW LLVIGVTGFV VEGLRIVGTN 
DPWAAWSPIG NLFAPLFAGL SAAQVSTAHQ VLWWFHMAIA FGILAYWMYS KLVHVLLVPA 
TVYCRPLEPK GTLSYVDLED EELEEFGVGK LEDFTWKDLL DAEACVRCGR CETVCPAHGS 
GKPLSPKDLM QALDAHLGER GPLVRAERRA EAAGEAFEPT EEQRAVLDKA LVGDVVAPEA 
LWSCTTCGAC MEACPALLEH VPKVVGMRTY QVSMESAFPS EAKAAFRNLE TNGNPWGLGW 
QSRMAWAEGL DVPTLADRPQ AEYVYWPGCS GAYDARNRKV SRALVALLRH AGVDFAVIGP 
EEKCCGDAAR RMGNEFLYYQ LATENIETLN AYGAKKIIVQ CPHCAQALER DYPQLGGRFE 
VVRHAQLLER LVAEGRLPGA ERAGAQAAFE RVTYHDSCYL GRYADVYDEP RAVVKACGAQ 
VVEMERTREK SFCCGAGGGR MWLEEREGRR MNVLRAEQAR DTGADAVATA CPFCLSMLED 
GLASQDDALP VRDIAELLSD ALALSR