Gene Emin_0876 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0876
Symbol
ID	6262597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	964062
End bp	965105
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	45%
IMG OID	642611355
Product	dienelactone hydrolase
Protein accession	YP_001875768
Protein GI	187251286
COG category	[R] General function prediction only
COG ID	[COG1073] Hydrolases of the alpha/beta superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000509815
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.000000000273866
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAATCTTA AACTAATACT AATAGTAGTA GCGGCGGCGG TTTTAACAAG TTCTATAGTA 
TGGGGTGTAT ATAAAATATG TAAGGGGACA ACAACGGCGG CTCATCTTAC ATTCCGGCAG 
AGCGATAGTG TGCGAATGGA AAAAGTTATA TTTAAAAACA GAATTGGCAT AGAAATAGCG 
GGACATATGT ATATGCCAAA AAATATTGAT AAAAATAAAA AACATCCCGC AATTGTTGTT 
GGCCATACTT TTACCGGTGT TAAGGAGCAA ACGTCAGGCC TGCATGCACA AAAATTGGCG 
GAAATGGGCT TTGTTACTCT TGCTTTTGAC GCTTCATTTT GGGGTGAAAG CGGCGGGCAG 
CCGCGCAATA TAGAAATACC TGATATCCGC ATAGAGGACT TTATTGCGGC GGTAGATTTT 
TTAAGCACCC AATCTTTAGT TGATGCAGGA CGCATCGGTC TTTTGGGTAT TTGCGGAGGC 
GGCGGATATG TGGTAAGTGC GGCGGCTATT GACCATAGAG TTAAAGCTGT TGCTACAGTA 
AGCATGTATG ACTTGGGCCG CGCACGCAGG CAGGGCCTTG GCGACGCTAT CTCCTACGAA 
CAACGCATGA AAACGCTTGA CCTTATAGGC GATTTACGCA CAAAGGAATT TAGAGGGGAA 
AAACGTACCG ATACTCTTGG CGTTCCTGCC AGTATTACTG ATAAAGATAC AGAAAACACC 
CGTGAGTTTT ATGACTATTA CCGCACGCCC CGTGCGCAAC ACCCAAATAC GGATACCGCA 
TACTCTTTAG TAAGCCAAGC GGCAATGATG AACTTCTTCC CGTTTATACA GATAGAAACA 
ATCTCACCCC GCCCGTTGCT ATTTATTGTT GGAGAGCGGG CCGTATCTGC CTACTTTAGC 
GAAGATGCTT ACAGCAAGGC AGCTCAGCCT AAGGAGCTAT ATGTAGTGCC CGGCGCGTCG 
CACGTGGACC TTTACGACAG GCCGGAATAT ATGAAATTAA CTATCCCGAA ACTGGATAGT 
TTCTTTAAGC AAAATCTTAA GTAA

Protein sequence

MNLKLILIVV AAAVLTSSIV WGVYKICKGT TTAAHLTFRQ SDSVRMEKVI FKNRIGIEIA 
GHMYMPKNID KNKKHPAIVV GHTFTGVKEQ TSGLHAQKLA EMGFVTLAFD ASFWGESGGQ 
PRNIEIPDIR IEDFIAAVDF LSTQSLVDAG RIGLLGICGG GGYVVSAAAI DHRVKAVATV 
SMYDLGRARR QGLGDAISYE QRMKTLDLIG DLRTKEFRGE KRTDTLGVPA SITDKDTENT 
REFYDYYRTP RAQHPNTDTA YSLVSQAAMM NFFPFIQIET ISPRPLLFIV GERAVSAYFS 
EDAYSKAAQP KELYVVPGAS HVDLYDRPEY MKLTIPKLDS FFKQNLK