Gene Elen_1154 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1154
Symbol
ID	8415444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	1386763
End bp	1388271
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	68%
IMG OID	645024116
Product	radical SAM family protein
Protein accession	YP_003181513
Protein GI	257790907
COG category	[R] General function prediction only
COG ID	[COG4277] Predicted DNA-binding protein with the Helix-hairpin-helix motif
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.848409
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTGG TTGCCAAGCT CGAGATTCTC GCCGACGCTG CTAAGTACGA CGTTGCCTGC 
ACGTCTTCGG GCATCGACCG CGACGCCCAG AAGGGCAAGC TCGGCAACAC GCTGGCCGCC 
GGCTGCTGCC ACAGCTTCGC GGCCGACGGG CGCTGCATCA CGCTGCTCAA GGTGCTCATG 
ACCAACGTCT GCGTGTACGA TTGCGCCTAC TGCGTGAACC GCGCGTCGAA CGAGGTGCCG 
CGCGCCGCGT TCAAGCCGCG CGAGCTGGCC GACCTCACCA TCGCGTTCTA CCGCCGCAAC 
TACATCGAGG GCCTGTTCCT CAGCTCAGGC GTCATCCGCA ACCCCGACTA CACCACCGAG 
CTCATGATAC AGACGCTGTC CATCCTGCGC GAGGAGCACG GCTTCCGCGG CTACATCCAC 
GCGAAAGCGG TGCCCGGCAC CTCGCCCGAG CTCGTGCAGC AGCTGGGGCA CTTGGCCGAC 
CGCATGAGCG TGAACATGGA GCTGCCCTCC CAGAAGAGCC TGCAGCTGCT CGCGCCCCAG 
AAGGACAAAC AGCGCATCAT CGCGCCCATG CGCCAGATCC GCGACAACAT CGCCGTGGAC 
AAGGACACGC GCGCGCTCGT GCGCAAGCAG ACCACCTACA TGAGGCAGAT CCGCCCCAAG 
AAGAAGGAGC GCGCCTTCGT GCCGGCCGGG CAGTCCACGC AGATGATCGT AGGAGCCTCG 
CCCGAAAGCG ACTTCCAGAT CCTCAACCTG TCGGCCGCGC TCTACCGCAC GCTGTCGCTC 
AAGCGCGTGT TCTTCAGCGC CTACACGCCG GTGAACGACG ACAAGCGCCT GCCCGGCACC 
GACGCCGTCC AGCTCAACCG CGAGCATCGG CTGTACCAGG CCGACTGGCT GCTGCGCTTC 
TACCGCTTCG ACGTCACCGA GATCATCGAC GAGGACAACC CCTTCCTCGA TCCCGACCTC 
GACCCGAAGG CGAACTGGGC CATCAACCAC CTGGACTTCT TCCCCGTGGA GGTGAACACC 
GCTCCGCTCG AGGCGCTGCT GCGCGTGCCC GGCATCGGCG TGCGCGGAGC GAACCTCATC 
GTGCGCGCGC GGCGCACCAC CTGCCTGCGC GAGCCCGAGC TGCGCAAGCT GGGCATCGCG 
TACAAGCGCG CCCGCTTCTT CATCACGTGC AGCGGCAGCT ACTCGGGGCG CGGCGTCGAC 
TTCTCGCGCG AAGGGCTGCG CGCGCAGCTT GCCGCGCCCA TCAAGGGCGG CAACCACGGG 
CGGCGCGCCG ACAAGACCAC ACCGGGTCAG ATGAGCCTGT TCGAGAGCGT CGAGACGCCC 
GAGAAGGCCC GCATCGCGGG CGGGTCGGGC GCACGCGCGC TGGAAAGCGG CGATGCGACC 
GCAGCGGCGT CTTGCAGCGA TGCGGAGCGC TCCTCGAACG CGGCGTCGTC GTCCGGCCGC 
GCCGCGAGCG CCGACGGGAC GTACGGTTGG CAGCGAGCCC TCGAAACGCC GGAAGCCGTG 
TGCGCATGA

Protein sequence

MDLVAKLEIL ADAAKYDVAC TSSGIDRDAQ KGKLGNTLAA GCCHSFAADG RCITLLKVLM 
TNVCVYDCAY CVNRASNEVP RAAFKPRELA DLTIAFYRRN YIEGLFLSSG VIRNPDYTTE 
LMIQTLSILR EEHGFRGYIH AKAVPGTSPE LVQQLGHLAD RMSVNMELPS QKSLQLLAPQ 
KDKQRIIAPM RQIRDNIAVD KDTRALVRKQ TTYMRQIRPK KKERAFVPAG QSTQMIVGAS 
PESDFQILNL SAALYRTLSL KRVFFSAYTP VNDDKRLPGT DAVQLNREHR LYQADWLLRF 
YRFDVTEIID EDNPFLDPDL DPKANWAINH LDFFPVEVNT APLEALLRVP GIGVRGANLI 
VRARRTTCLR EPELRKLGIA YKRARFFITC SGSYSGRGVD FSREGLRAQL AAPIKGGNHG 
RRADKTTPGQ MSLFESVETP EKARIAGGSG ARALESGDAT AAASCSDAER SSNAASSSGR 
AASADGTYGW QRALETPEAV CA