Gene Elen_0085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0085
Symbol
ID	8414366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	112482
End bp	113828
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	62%
IMG OID	645023062
Product	citrate synthase
Protein accession	YP_003180468
Protein GI	257789862
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.691353
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAACTG AAAGCCAGAT CGCTCTGTAC GAGAACTTCA AGGCGATCAA CACCATCGAA 
ACCGCGAGCT ACGACCAGTT CGACGTGAAG CGCGGCCTGC GCAACGCCGA CGGCACGGGC 
GTCATCGCAG GTCTTACGAA CATCGCCAAC GTTCACGGCT ACGTGGTCTC AGACGGCGAG 
AAGGTAGCCG ACGAGGGTAT GCTGCGCTAT CGCGGCTACG ACGTGTACGA CCTGCTGGAC 
ACCAGCGTGG CCGATCGCCG CTTCAACTTC GAGGAGGTGG CGTACCTGCT GCTCATGGGC 
GAGCTGCCCA CACAGGAGCA GCTCGACCGC TTCATCGCCG CGCTCGATGC CGAACGCGAA 
CTGCCCGACG GCTTCACTGC CTCCATGATC ATGCGCGACA CCCCGCCCGA CATCATGAAC 
ATGCTGCAGC GCACCATCCT GCTGCTGTAC GCCTACGACG CGGACGCCGA GGATCGTTCG 
GCTCATCACG AGATCCACAC CGCCATCTCG CTGATCTCGC GTCTGCCGCG CATCATGGTG 
CTGACCTACT ACGCGAAGCA GGCTCGCTAC AACAACGGCT CCATGATCAT GCATCGCTTC 
ATTCCCGGTC AGTCCACGGC CGAGACCATC CTGTCCATGC TGCGTCCCGA TCGCCAGTTC 
ACGGCTGAGG AAGCGCGCAT GCTGGACATC ATGCTGTGCC TGCATGCCGA GCATGGCGGC 
GGCAACAACT CCACGTTTGC CACGCGCGTG CTGACCTCGT CCGACACCGA TCCGTACTCC 
ACGTACGCCG GCGCTATCGG TTCGCTCAAG GGGTCGAAGC ATGGTGGCGC GAACCATCAG 
GTGCTAGCTA TGCAGCAGGA GATCAAGCAG AACGTAGCCG ACTGGTCCGA CGAGGGCCAG 
GTGGCCGATT ACCTGGCGAA GATTGTCAAC AAGGAGGCTT TCGACAAGAC GGGTCTCGTG 
TACGGCATGG GGCATGCGGT GTACACGAAG TCCGACCCGC GCGCCATCAT CTGCAAGCAG 
TTCGCCGAGA AGCTGGCCGT GGGCACGGAG TTCGAGGCCG AGTATCGTCT GCTGGAAAGC 
ATCGAGCGCC TGGCGCCCGA GGTGATTCTG CGTGAAAAGG GCACCAGCAA GGACATGTGT 
GCGAACATCG ACATGTATTC GGGCTTCGTG TACTCGATGA TGGGCATTCC CGAGGATCTG 
TTCACGCCGC TGTTCGCGTG CGCGCGCATG TCCGGCTGGG CTGCGCACCG CTTCGAGGAG 
ATCGTCTCCG GCAAGCGCAT CATCCGTCCT GCGTACAAGT CCATTCGCAG CGGCAAGCGC 
GATTACGTTC CCATGAGCGA ACGCTAG

Protein sequence

MATESQIALY ENFKAINTIE TASYDQFDVK RGLRNADGTG VIAGLTNIAN VHGYVVSDGE 
KVADEGMLRY RGYDVYDLLD TSVADRRFNF EEVAYLLLMG ELPTQEQLDR FIAALDAERE 
LPDGFTASMI MRDTPPDIMN MLQRTILLLY AYDADAEDRS AHHEIHTAIS LISRLPRIMV 
LTYYAKQARY NNGSMIMHRF IPGQSTAETI LSMLRPDRQF TAEEARMLDI MLCLHAEHGG 
GNNSTFATRV LTSSDTDPYS TYAGAIGSLK GSKHGGANHQ VLAMQQEIKQ NVADWSDEGQ 
VADYLAKIVN KEAFDKTGLV YGMGHAVYTK SDPRAIICKQ FAEKLAVGTE FEAEYRLLES 
IERLAPEVIL REKGTSKDMC ANIDMYSGFV YSMMGIPEDL FTPLFACARM SGWAAHRFEE 
IVSGKRIIRP AYKSIRSGKR DYVPMSER