Gene Elen_3101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_3101
Symbol
ID	8417437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	3607549
End bp	3608793
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	64%
IMG OID	645026081
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_003183432
Protein GI	257792826
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.000328223
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTGATT TGAAGCTTCT TGATGGCGTC AAAGTCGTCG ACATGTCCGC GTTCGTCGCG 
GCACCGATGG CCGCCGAGAT CCTGGCCGAA TACGGTGCGG ACGTCGTTCG CATCGAACCG 
CTGACCGGCG ACGGCATCCG CGGCTCGGGC ATGACGCAGA ACATCTACAA CGGCGACGCC 
CCGCTGTACG ACGCCATCAA CGGCAACAAG CGCCACATCG CGGTGAACAC GCGCACGGCG 
GAGGGCATGG GCGTGCTGTG GAAGCTGCTG GAGACGGCCG ACATCTTCAT CTGCCACATG 
CGCGAGAAGG ATATGGTCAA GCTGGGCATC GACTGGGATA CGCTGCATGC GAAGTTCCCG 
GCGCTGATCT ATGCCAACAC CACCGGCTAC GGCAGCACGG GCCCGCTGGC CAGCCGCGGC 
GGCTTCGACA TGATCGCCTA CGCCACGCGC ACGGGACTCA CCACCGACGT GGTTCCCGAG 
GGCGCGCATC CCTACATGCC CTACCAGGCG CAGGGCGACA TCCCCACGGG CCTGTACCTG 
TCCATCGGCA TCATGGCCGC GTACATCAAC CGCCTGCGCA CGGGCCTGGG CGACCAGGTG 
TCGTGCAGCC TGTACGGCTC CGGCATGATG AGCGCGATGG TGCCCATCCT CTCCGGCCAG 
AAGCCCTACA ACAACCTGTG GCCGAAGGGC CGCGAGAACG TCCTTCCGTT CTCCTGCATG 
TACCGCGGCT CGGACGACCG CTGGATCATG GTTGCCGGCC TGCAGTGGCA TAAGGACTGG 
CCGCGCTTCG TGGCGCGCCT GGGCCTCGAC CCCGAGCTGG TGACGAAGTA CCCCGACTAC 
ATGACCGCGC TGGCCAAGTC CAACGAGATC ATCCCCATGC TGGACGAGTT GTTCGCTACC 
AAGACCGTGC AAGAGTGGAG CGACATCCTC ACCGAGGAAG ACATCCCCAA CGACATCTGC 
CTGAAGTTCA GCGAAGTCGC CGACGATCCC GCGGTGCTGA CCGGCAACCT TATGAAGGAA 
GTCGAGATGC CCAGCGGCGA GGTCATCAAG ATGCCGCGCA CCCCGGTCTA CTTCCGCGAG 
GCCGGCGCTC CCGACCCGGT CGTTGCTCCC ACCGTGGGTG CCGACACCGA GGTCGTGCTG 
AAGGAATGCG GCTACACCGA CGAGGAGATC AAGAAGATGG CCGAGGAGAA GGTCGTCGGC 
CTGGGCGACA CCTGGGATCG CTCCATGTAC GTCATCAAGT TCTAA

Protein sequence

MSDLKLLDGV KVVDMSAFVA APMAAEILAE YGADVVRIEP LTGDGIRGSG MTQNIYNGDA 
PLYDAINGNK RHIAVNTRTA EGMGVLWKLL ETADIFICHM REKDMVKLGI DWDTLHAKFP 
ALIYANTTGY GSTGPLASRG GFDMIAYATR TGLTTDVVPE GAHPYMPYQA QGDIPTGLYL 
SIGIMAAYIN RLRTGLGDQV SCSLYGSGMM SAMVPILSGQ KPYNNLWPKG RENVLPFSCM 
YRGSDDRWIM VAGLQWHKDW PRFVARLGLD PELVTKYPDY MTALAKSNEI IPMLDELFAT 
KTVQEWSDIL TEEDIPNDIC LKFSEVADDP AVLTGNLMKE VEMPSGEVIK MPRTPVYFRE 
AGAPDPVVAP TVGADTEVVL KECGYTDEEI KKMAEEKVVG LGDTWDRSMY VIKF