Gene Elen_1225 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1225
Symbol
ID	8415516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	1472243
End bp	1473628
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	67%
IMG OID	645024188
Product	tryptophan synthase subunit beta
Protein accession	YP_003181584
Protein GI	257790978
COG category	[R] General function prediction only
COG ID	[COG1350] Predicted alternative tryptophan synthase beta-subunit (paralog of TrpB)
TIGRFAM ID	[TIGR01415] pyridoxal-phosphate dependent TrpB-like enzyme

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.524383
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.0499617
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAC AAGCACCGCA TCGTCTGTAC CTGCGCGAAG ACCAGATCCC GACGCAGTGG 
TACAACCTGC GGGCCGACAT GCCGGAGAAG CCGGAGCCCA TCCGGCTGCC GAACGGCCAG 
GTCGCGGCAC CTGAGGATCT GGCACCTGTG TTCTGCGACG AGCTGGTGCG CCAGGAGCTG 
GACGACGACA CGGCCTACGT CGACATCCCC GAACCGGTGT TGGAGATGTA CCGCATCTAC 
CGCCCGTCGC CCTTGTGCCG CGCGTACAAC CTGGAGAAGG CCCTCGGCAC GCCCGCCAAG 
ATCTACTACA AGTTCGAAGG CAACAACACG TCCGGCTCGC ACAAGCTGAA CTCTGCCATC 
GCCCAGGCTT ATTACGCGAA GGCTCAGGAT CTCGACGGCA TCACCACCGA GACGGGTGCG 
GGCCAGTGGG GCACGGCGCT CGCCGAGGCG TCGGCGCATT TCGGGCTCAA TCTGGACGTG 
TTCATGGTGA AGTGCTCCTA CGAGCAGAAG CCGTTCCGCC GCAACATCAT GGAGACGTTC 
GATGCGCACG TGACGCCCTC GCCGTCCGAT ACCACCGAGA TCGGCCGCAA GATGCTCGCC 
GAGCATCCCG ACTCCTCGGG CTCGCTGGGC ACGGCCATCT CCGAGGCCGT GGAACGCGCG 
CTCAACATTC CCGGCAACAA GGGCCGCTAC ACGCTGGGGT CGGTGCTCAA CCAGGTGGTG 
CTGCACCAGT CGGTCATCGG CTTGGAGAGC TACGCTGCCT TCGAGGAGCT GGGCGAGTAC 
CCCGACGTGG TCATCGGCTG CGCGGGCGGC GGCTCGAACC TCGGCGGCCT CATCGCGCCG 
TTCATGCGCG ACAAGATCAA AGGCGTCCGT CCCGACACGC GCTTCGTCGC CGTCGAGCCG 
GCCAGCTGCC CGAGCCTCAC GCGCGGGCGC TACGCCTACG ACTTCGCCGA CACGGGCCGC 
ACCTGCCCGC TCGCGAAGAT GTACACGCTG GGCAACGGCT TCCTGCCCAG CCCCGACCAT 
GCTGGCGGCC TGCGCTACCA CGGCATGAGT CCCATCGTGT CGAAGCTCAA GCACGACGGC 
TACCTGGACG CCGTGGCCGT GAAGCAGACC GACGTGTTCG CGGCGGCCGT GGAGTTCGCG 
CGGCTCGAGA CCATCCTGCC GGCTCCCGAG AGCGCCCACG CCATCTTCCA GGCCGTGGAG 
GAGGCCAAGC GCTGCGCCGA GACGGGCGAG GAGAAGACGA TCCTCTTCGG CCTCACGGGC 
ACGGGCTACT TCGACATGAA GGCCTACGAC GCGTACAACC GCGGCGAGAT GAGCGACCAT 
GTCCCCACCG ACGAGGAGCT GGAGGCGGGC TTCGCCAGCA TCCCGCACAT CGAGGGCGTG 
CAGTAG

Protein sequence

MTEQAPHRLY LREDQIPTQW YNLRADMPEK PEPIRLPNGQ VAAPEDLAPV FCDELVRQEL 
DDDTAYVDIP EPVLEMYRIY RPSPLCRAYN LEKALGTPAK IYYKFEGNNT SGSHKLNSAI 
AQAYYAKAQD LDGITTETGA GQWGTALAEA SAHFGLNLDV FMVKCSYEQK PFRRNIMETF 
DAHVTPSPSD TTEIGRKMLA EHPDSSGSLG TAISEAVERA LNIPGNKGRY TLGSVLNQVV 
LHQSVIGLES YAAFEELGEY PDVVIGCAGG GSNLGGLIAP FMRDKIKGVR PDTRFVAVEP 
ASCPSLTRGR YAYDFADTGR TCPLAKMYTL GNGFLPSPDH AGGLRYHGMS PIVSKLKHDG 
YLDAVAVKQT DVFAAAVEFA RLETILPAPE SAHAIFQAVE EAKRCAETGE EKTILFGLTG 
TGYFDMKAYD AYNRGEMSDH VPTDEELEAG FASIPHIEGV Q