Gene Msed_1125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1125
Symbol
ID	5103597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1054839
End bp	1055981
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	49%
IMG OID	640507018
Product	mandelate racemase/muconate lactonizing protein
Protein accession	YP_001191211
Protein GI	146303895
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACATTC AGATTTTTCC CCTATCTATT CCATTTTTTA CTGATCCTGT GTCAGAATTT 
TCTGATCAAT GGTCAGTGCA GTTATACGTG AAGGCAAGTT GGGATGACGT GAGTGGTTGG 
GGAGAGACCG GCGTCTTCGG GAGCGGAATA CTAGGGGCCT ACGTCTCAAT CCTCAAGGAA 
TTGATTGTCC CTCTTCTCAG TAGGTATCCC ATCACCTTAC CTTACGACGT TGAGACCTTC 
CTAGAGAAGG TAATGTTAAC AGCGGGTAAC TGTGGAGTTG TTACGGGGGC CATAAGCTCA 
GTGGAAATGG CCATGTGGGA CGCTAGGGCA AGGAAGCTTA ACACGTCCCT GGCGGAAATG 
CTTGGCGGGA GGGTTAGGGA AAGGGTGCCC GTTTACGGCA GTTTCCCAAG GTTTAAGTCC 
AGTGAGGATG TCGTATCCAC TGTAGTTAAG ACGACCGAGA GAGGTTACAA GATGATCAAG 
TTGCATCAAC CTCCGTCCTC CGTGGTGGAG GACCTCCACG AGATCAGGGA GAAGATCGGA 
TACGACGTGA AGGTTGCCCT AGACATGAAC GCTCCCTTCG ACCTGGAGAG CGCGAAGAAG 
TTCGTGGACG CGGTGGCTAA ATACGAGGTG GAGTGGGTAG AGGAGCCCAT CTGGCCCTTG 
GATGATTACG ATTCATTGAG AAAGCTATGC GATTACTCCC CTGTACCCAT AGCTGCAGGG 
GAGAACGAGT ACACCATACA CGGCTTCAGG AGGCTATTGG AGACCGGAAT CGCCTACCTT 
CAACCTGACA TAGCCAAGAT TGGGGGAGTA AGTAAGTTCC TGAAGGTTCT GGACTTAGCC 
TCAGGTTATA ACGTGAAGGT TGCCCCGCAT GACAGGCCAG ATTCCTCACC GCTTTCCTTG 
ATGTATGTCC TTCAGATCGC CTCCGCAAGG TCCGAAATTA GTATCATAGA GTTCACCATC 
TCGGATTTTC CATCAGGTTT ATTCGAAAAC ATACCCAGAT TTCGTCACGG GACACTGGAG 
GTTCCAGCGG GTCAAGGTAT TGGGCTCAAA GTTAAAGAAG ATCAACTAGA AAAATATTCT 
TACGAGGAAA AACTAAGAAT ACTCGCCTTT AGCGACCTTG AAGCCAAACT AAGGGATAAA 
TAG

Protein sequence

MNIQIFPLSI PFFTDPVSEF SDQWSVQLYV KASWDDVSGW GETGVFGSGI LGAYVSILKE 
LIVPLLSRYP ITLPYDVETF LEKVMLTAGN CGVVTGAISS VEMAMWDARA RKLNTSLAEM 
LGGRVRERVP VYGSFPRFKS SEDVVSTVVK TTERGYKMIK LHQPPSSVVE DLHEIREKIG 
YDVKVALDMN APFDLESAKK FVDAVAKYEV EWVEEPIWPL DDYDSLRKLC DYSPVPIAAG 
ENEYTIHGFR RLLETGIAYL QPDIAKIGGV SKFLKVLDLA SGYNVKVAPH DRPDSSPLSL 
MYVLQIASAR SEISIIEFTI SDFPSGLFEN IPRFRHGTLE VPAGQGIGLK VKEDQLEKYS 
YEEKLRILAF SDLEAKLRDK