Gene Elen_3064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_3064
Symbol
ID	8417399
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	3561657
End bp	3563237
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	68%
IMG OID	645026044
Product	Hydantoinase/oxoprolinase
Protein accession	YP_003183396
Protein GI	257792790
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0145] N-methylhydantoinase A/acetone carboxylase, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGATC AGAAGCGCAT CTGGCGTCTG GGTATCGACG TGGGCGGCAC GAACACCGAC 
GCGGTGGTCA TCGACGGCGA CCTCAAGCTG GTGGCCGCGA CGAAAAGCCC CACCACCGAG 
GACGTCATGA GCGGCATCGT GGCCGCCATG CACGAGGTGA TCACCCAGAT CGGTGCCGAC 
GAGGCGCGCA ACATCGGGTT CGCCATGCTG GGCACCACGC ATTGCACGAA CGCCATCGTC 
GAGCGCAAGC GCCTGAACAA GGTGGCCGCG CTGCGCGTGG GCGCTCCGGC CACGACGGCC 
ATCAGCTGCA TGGCTGACTG GCCCGACGAG CTGAAGAACG CCATGCGCGT GCGCGACTTC 
CTCGTGCACG GCGGCAACGA GTTCGACGGT CGCGAGATCA GCGCGCTGTC GGAAGACGAG 
ATCCGCGAGG TCGCGCGCGT CGTGCGCGAA GAGGGCTTCG AGTCCGTGGC CGTGACCAGC 
GTGTTCTCGC CGGTGTCCGA CGCGCACGAG AAGCGCGCCG CCGCCGTTCT GCGCGAGGAG 
CTGGGCGAGG GCTTCCCCAT CACGCTGTCG TCGGAGATCG GGTCGCTCGG CTTCCTCGAG 
CGCGAGAACG CGTCCATCCT GAACGCGGCG CTGTACGACG TGGCGCGCAC GACGGCCGAC 
AGCTTCGAGG CGGCGCTCGC GTCTGAGGGC CTCGCCGATG TGGCTGTGTA CCTGGGCCAG 
AACGACGGCA CGCTCATGAG CGTGGACTAC GCGAAGCGTT ACCCCATCTT CACCATCGCG 
TGCGGGCCTA CGAACTCCAT CCGCGGCGCG TCGTTCTTGA CGCAGGAGAA GGACGCCGTG 
GTCGTCGACA TCGGCGGCAC CACCACCGAC GTGGGCGTGC TGGCGCACGG CTTCCCGCGC 
GAGAGCATGG TGGCCGTGGA AATCGGCGAC GTGCGCACGA ACTTCCGCAT GCCCGACCTG 
GTGTCGGTGG GCCTCGGCGG CGGCTCGCTC GTGCGCCAGC TGGAGGACGG CAGCGTGACG 
GTGGGCCCCG ACAGCGTGGG CTACCTGGTC ACGAAGAAGG CGCGGTGCTT CGGCGGCGAC 
ACGCTGACTG CGACCGATAT CGTGGTGGCG AAGGGCCTGG CCGAGGGCGT GGGCGATCCG 
ACGCTGGTGG CCGACCTCGA GCCGGCGCTC GTGGACGCGG CCTATGCCGA GATCACGCGC 
ATCATCGAGG ACGCGGTGGA CGCGATGAAG ACTTCGGCCG GCGACGTGAC GGTGATTCTC 
GTGGGCGGCG GCTCCATCCT GGCGCCCGAC CAGCTGGAAG GCTCGGACAA CGTGCTGCGC 
CCTGAGAACT TCGGCGTGGC GAACGCGGTG GGTTCGGCCA TCGCGCAGGT GTCCGGCCAG 
ATCGCCAAGG TGTTCTCGCT GACCGAGACG CCGCGCGAGC AGGCGCTTGC CGAGTCGAAG 
CAGCGTGCGT GCGACGAGGC CATCGAAGCC GGCGCCGATC CGAGCACCGT GGAAGTGGTC 
GACGTCGAGG ACATCCCGAT GGCCTATCTG GGCGATGCGC TCTGCATTCG CGTCAAAGCC 
GTCGGCGATC TGATGCTTTA A

Protein sequence

MADQKRIWRL GIDVGGTNTD AVVIDGDLKL VAATKSPTTE DVMSGIVAAM HEVITQIGAD 
EARNIGFAML GTTHCTNAIV ERKRLNKVAA LRVGAPATTA ISCMADWPDE LKNAMRVRDF 
LVHGGNEFDG REISALSEDE IREVARVVRE EGFESVAVTS VFSPVSDAHE KRAAAVLREE 
LGEGFPITLS SEIGSLGFLE RENASILNAA LYDVARTTAD SFEAALASEG LADVAVYLGQ 
NDGTLMSVDY AKRYPIFTIA CGPTNSIRGA SFLTQEKDAV VVDIGGTTTD VGVLAHGFPR 
ESMVAVEIGD VRTNFRMPDL VSVGLGGGSL VRQLEDGSVT VGPDSVGYLV TKKARCFGGD 
TLTATDIVVA KGLAEGVGDP TLVADLEPAL VDAAYAEITR IIEDAVDAMK TSAGDVTVIL 
VGGGSILAPD QLEGSDNVLR PENFGVANAV GSAIAQVSGQ IAKVFSLTET PREQALAESK 
QRACDEAIEA GADPSTVEVV DVEDIPMAYL GDALCIRVKA VGDLML