Gene Elen_1850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1850
Symbol
ID	8416154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	2175170
End bp	2176480
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	62%
IMG OID	645024820
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_003182203
Protein GI	257791597
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.263908
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.861601
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTCA CTGAGAAACT CAATGGCTAC GGCCCGCTTG CGGGCATCAA AGTGGTCGAG 
ATGTGCACGT ACGTCGCAGC TCCCGCAACC GTCAGAGTAT TGTCCGAAAT GGGCGCCGAA 
GTTCTGAAGA TCGAATCGTT CGACGGCGAT ATCCAGCGCA CGCAAGGTCC GGGCTTCGGC 
TGCGATCTGA CCGACACCGA GGATCCGACC ATCGACCTCA ACAACACCAA CAAGAACTGG 
ATCTCCCTCA ACTTGAAATC CGAGGAAGGT CTGGCCATCG CGAAGAAGAT GATCGGCGAA 
GCAGACATCT TCATGAACAA CATGCGCACG GCCGCCCTGG AGAAGCTGGG CCTCGACTAC 
CCCACGCTGT CCGCCGAGTT CCCCGGTCTT ATCTGGGCTC AGATGCGCGG CTACGGCGAG 
TTCGGCGAGT TCGCACACTC CCCCGGCTAC GACGCTGTGT GCTGGGCTGC CCGCGGCGGC 
GTCGCGGGTA CCTTCTGCGA GAAGGGCACG TCGCCGGCCA TTCCTCCCCA AGCGTTCGGC 
GATTACAACA CCGCGACCAT GATGGCCGCC GGCATCTTGG GGGCGCTGGT GAACAAGCTG 
CGCACGGGCA GGGGCGACAA AGTCGTCGTC AACCTGTACC ACTCCGCCAT CTGGGGCGGC 
AGCATCGCCG TGTGCGCGCA GCAGTTCGGC GCCGACTACC CGAAGACGCG CAAGGACGTG 
CCGAACCCGT TCAACAACAC GTACAAAACC GCGGACGACA AGTGGATCTA CATCTGCCAG 
CCGCAGCATA ACCGCTATTA CAACGACATG ATGAAGATCA TCGGCCGCGA CGACCTGGTC 
GACGATCCGC GCTACGCCAC GGTTGAGAAC CTCAAGGAAA AGCACCTGCA GCCGGAGCTC 
ATCGAGATCC TCGAAGGCGG ATTCGTCCAG AAAACGCTCG ACGAGTGGCT GCCCATCCTG 
GCCGAATGGC AGGTGCCCAG CCAGAAGGTC TTCCGTTACA CCGACATCGT CAAGGACGAG 
GAGGCGTACG TCAACGACGC TATCCGCAAG GTGAACTACC AGGCCTTCGG CGAGCGCGCG 
CTGCCCACCA CCCCGATCCG CTACGCGAAC TTCGGCGATC CCCCGGTGGT GCTGTCCAAG 
CCCATCGGCT ACCACACCGC CGAGTACCTG CACAAGTACG GCTACACCGA TGAGCAGATC 
GCCGAGATGG AAGCCGCCGG TGCCGTCAAG TGCTATCACG GCGAGGAAGT GCCGGACGTC 
ATCTTCAAGT CCGAGCGCCA GCTCGCCGGC GAGGCTCCCT GCAACTGGTA G

Protein sequence

MTVTEKLNGY GPLAGIKVVE MCTYVAAPAT VRVLSEMGAE VLKIESFDGD IQRTQGPGFG 
CDLTDTEDPT IDLNNTNKNW ISLNLKSEEG LAIAKKMIGE ADIFMNNMRT AALEKLGLDY 
PTLSAEFPGL IWAQMRGYGE FGEFAHSPGY DAVCWAARGG VAGTFCEKGT SPAIPPQAFG 
DYNTATMMAA GILGALVNKL RTGRGDKVVV NLYHSAIWGG SIAVCAQQFG ADYPKTRKDV 
PNPFNNTYKT ADDKWIYICQ PQHNRYYNDM MKIIGRDDLV DDPRYATVEN LKEKHLQPEL 
IEILEGGFVQ KTLDEWLPIL AEWQVPSQKV FRYTDIVKDE EAYVNDAIRK VNYQAFGERA 
LPTTPIRYAN FGDPPVVLSK PIGYHTAEYL HKYGYTDEQI AEMEAAGAVK CYHGEEVPDV 
IFKSERQLAG EAPCNW