Gene Elen_0144 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0144
Symbol
ID	8414428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	200107
End bp	201246
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	58%
IMG OID	645023124
Product	protein of unknown function DUF6 transmembrane
Protein accession	YP_003180527
Protein GI	257789921
COG category	[R] General function prediction only
COG ID	[COG2962] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.6072
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGACA ACGCTAACAA GGAAATCAAG ACCGCGACAG CCGATGACGG CTCGACCGGC 
TACGAGATGA AGATCGGTCT TGGCACCATT GCCATGCTGA TCTCGGCGAC GGGCATGGGC 
TTGGTGCCCC TGTTCAGCCG CTGGGCAACT CGTACGGACA TGTTCGACGG GGCGCTGGGT 
CTGAACGCTG GCGACTCCAT CGGTGCTTTG ATGGCCGTGG GCCGCATGAG CATGGGCGTG 
CTGTTCTTCG TCGTCATCAT GTTCGCTACG GGCAAGGTAG AGACGTTCAA GAAACTCAAG 
CTGACGCCGG CCATCGCGTT GGGCGGCTTG ATGATCGGCA TGTCGCTGGC GTGCTACGTG 
ACGTCTACGC TGTTGACCAC CATCTCGAAC GCTGTTCTGT TCATCTACAT CGGTCCTGTC 
GTTTGCGTAG TGCTCGCGCG CATCTTCCGC AAGGAACCCA TGTCTGCTTT ACAGTGGGTA 
TGCCTGGTTG CGGTGTTCAT CGGCATGTTG TTCGGCAACA ACCTGATGGG TTTCAACGAG 
TCTGGCTTCT TCGTAGACTT CAACCTGGTT CCGTCTACGC CTGAGTTCCC GCAGAAGGGT 
CTCGGCGACG CCTTCGGCCT GGCTTCCGGC TTCTTCTACG GCGCTTCGAT GTTCTTCAAC 
GGCTACCGTA AGGACGCCGA CACCACGGCT CGTGGTGTGT GGAACTTCAT CTTCGCCGTC 
CTGGGCGCTG GTGTTATCAC CGTCGTCCTG AACTCGCTCG GTGCAAACCC CGGCATGGAG 
AACTGGGCTC TCAACATCCA CTTCACCGCA TTCAACTGGA TCGGTGCCCT GCTTTTGTGG 
GTCATCTGCG GTCCTGTGGC TCTGGGCTTC TTGCTGGTGG CTGGCCGCAA CCTGCCGGCT 
GCTGACTACG GCACCATTGC GTACTGGGAA GTTCCCGTGG CCATCTTCGT GGGTCTGGTC 
GTGTTCGGCG AGGCCCTGAC GGTTAACACG ATTCTCGGTG GCATTCTCAT CATCGGCGGC 
GGCGCTATCC CCTCTATCAA GGGCATGCTT TCCGCTCGCA AGATGAGAAA AGAAGAGGAG 
ATTTGCGAGA ATCTTGCCGC TCGCTTGGAA GAGGAAGAAG TCAAGGAGCA CCTGCAGTAG

Protein sequence

MADNANKEIK TATADDGSTG YEMKIGLGTI AMLISATGMG LVPLFSRWAT RTDMFDGALG 
LNAGDSIGAL MAVGRMSMGV LFFVVIMFAT GKVETFKKLK LTPAIALGGL MIGMSLACYV 
TSTLLTTISN AVLFIYIGPV VCVVLARIFR KEPMSALQWV CLVAVFIGML FGNNLMGFNE 
SGFFVDFNLV PSTPEFPQKG LGDAFGLASG FFYGASMFFN GYRKDADTTA RGVWNFIFAV 
LGAGVITVVL NSLGANPGME NWALNIHFTA FNWIGALLLW VICGPVALGF LLVAGRNLPA 
ADYGTIAYWE VPVAIFVGLV VFGEALTVNT ILGGILIIGG GAIPSIKGML SARKMRKEEE 
ICENLAARLE EEEVKEHLQ