Gene Elen_2266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_2266
Symbol
ID	8416590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2662890
End bp	2664440
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	70%
IMG OID	645025252
Product	protein of unknown function DUF92 transmembrane
Protein accession	YP_003182615
Protein GI	257792009
COG category	[S] Function unknown
COG ID	[COG1836] Predicted membrane protein
TIGRFAM ID	[TIGR00297] conserved hypothetical protein TIGR00297

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGGCG ACGTGATGGA GAACCTGATC GGCTTGGGCG TCTCGCTCGC GTACGTACTG 
GCGGTGCTGG GAGCGTCCAG CCTGGCCGCG CGGCGTGGCG CGTCGTCGGA GGCAACCCGC 
AAGTTCGTGC ATATCGCGTT GGGCGGCTGG TGGCTCATCG CGGCCCGGTT CTTCGATTCG 
CCTCTGTGGG CGGCGGCGCT TCCTGCTGCG TTCATCCTTG TGAACGCGTT TGCGTACCGT 
CGGCAGAAGC TGTCGTTCAT GGGACGCGAC GGCGGCGAGG ACACGCCGGG CACGGTGTAC 
TACGCGGTGT CGCTGACGGC GCTCGCGCTG TTCTCGTTCG GTATCGGCAC GCCGTACGTG 
GGCGCGCTCG GCTTCTTCTG TATGGCGTTC GGCGACGGGT TCGCAGCTGT GCTGGGCAAG 
CGGTTCGGAC GACGCGTGCT GGTGGGATGC TGCGGGAAGA CGCTGGTGGG AAGCGCGACC 
ATGCTGGCGG TGAGCTTCGC TTCCTGCGCC GTCGTGCTGA TGGCGCCGCC GCCTTTCGGT 
GCGGGCGGCA TCCTGGGCGC GCCGGGCGGC GCGTTCGCCC CGCTGGGCTC GCTCGCGGCG 
TCGCTTCTGG CCGCGGCCCT GCTGGCCGCG GTCGCCGCTG CCATCGAGGC GTTCTCGGTG 
GAGGGGCTCG ACAACCTGTT CGTGCCGCTG GGCGTGTCGG CGCTGTACGC GGTGCTGTTC 
CTGCCCGCAG CCGCCTACAC GCCCGCGCTC GCGGGATTGC TGCTGTCGGG CGCGGTGGCG 
CTCGCGTCGT TTCGGCTGCG GCTGCTCACC GTGGCCGGCG GCCTCGGCGC CGTGGCGGTG 
GGCACGCTCG CGTTCGCTAT CGGCGGGTGG CCGCTGTGGC TGCTGCTCAT GTGGTTCTTC 
GGCAGCTCGA ACGTCGCGTC GAAGCTGATG GCGCTTTCGG CGGTCAAGCG GAACGGCGGG 
GCGCCCGCTT CGCGTAAGCA CAGCGGCCCG CGTACGTTGC GGCAGGTGCT GGCGAACAGC 
GTGCCGTTCC TCGCGTGCGC GCTGGCGTAT ACGGCGACGG GGGAGCCGTG GCTGCTGCTT 
CTGGCGTCCG GCGCTCTGGC GGCCAGCACG GCCGACACGT GGGCGTCGGA GGTGGGCGTG 
TACAGCCGCC GGCCGCCGGT GAACATCCTC ACGCGCGAGC CCATGCAGCG CGGGCTTTCG 
GGCGGCGTGA GCCCGTTGGG TCTCGCGGCC ACCGTGGTGG GAGCCGTAAC CTCGGCGTTT 
CTGGCCATGC TGCTGTTCCA TGCGTTCGGC TACGCGATTC CCACCGGGCC CGACGCGTTC 
TTCTTCATCA TCGCGTGCGG CGTCGTGGGC TCGCTCGTGG ACAGCGTGCT GGGCGTGGTC 
ATGCAAGCGA AGTACCGCTG TCCGAACGAC GCTGAGGGAG GGCTTGTGGA AACGCCGCCG 
TGCGGGGCCC AGGCCGCGCT CGTGTCCGGC TACGCCTGGG TCACGAACGA TGCCGTCAAC 
CTCATGAGCG GCATCGCCGT CGTGCTGCTC GGCCTGCTCG TAGTGGTGTA G

Protein sequence

MMGDVMENLI GLGVSLAYVL AVLGASSLAA RRGASSEATR KFVHIALGGW WLIAARFFDS 
PLWAAALPAA FILVNAFAYR RQKLSFMGRD GGEDTPGTVY YAVSLTALAL FSFGIGTPYV 
GALGFFCMAF GDGFAAVLGK RFGRRVLVGC CGKTLVGSAT MLAVSFASCA VVLMAPPPFG 
AGGILGAPGG AFAPLGSLAA SLLAAALLAA VAAAIEAFSV EGLDNLFVPL GVSALYAVLF 
LPAAAYTPAL AGLLLSGAVA LASFRLRLLT VAGGLGAVAV GTLAFAIGGW PLWLLLMWFF 
GSSNVASKLM ALSAVKRNGG APASRKHSGP RTLRQVLANS VPFLACALAY TATGEPWLLL 
LASGALAAST ADTWASEVGV YSRRPPVNIL TREPMQRGLS GGVSPLGLAA TVVGAVTSAF 
LAMLLFHAFG YAIPTGPDAF FFIIACGVVG SLVDSVLGVV MQAKYRCPND AEGGLVETPP 
CGAQAALVSG YAWVTNDAVN LMSGIAVVLL GLLVVV