Gene Msed_1118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1118
Symbol
ID	5103591
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	1045882
End bp	1047240
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	42%
IMG OID	640507012
Product	D-lactate dehydrogenase (cytochrome)
Protein accession	YP_001191205
Protein GI	146303889
COG category	[C] Energy production and conversion
COG ID	[COG0277] FAD/FMN-containing dehydrogenases
TIGRFAM ID	[TIGR00387] glycolate oxidase, subunit GlcD

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.410973
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGATTT CTTTGTCCGA AAACATTCTA AGGGAATTGG ATGGAATTAA GTGTTCGTTG 
GAAGAAAGGA CAGATTTCCT CAATAATAGA GTAAGACCAG TCGTGGTGAC TTACCCATCT 
AGAACTGAGG AAGTAGCGAA AATAGTAAAT ATTGCAAGAG AACATGGTTT ACCCATCGTA 
GTCTGGGGTG GAGGTACCAG TTTAGCCGGG CACTTGGTAT GTGATGGTTG TATTTTAATT 
GACATGAAGT TCATGGACAA GATAGTCGAG ATAAATGATA CGGAATGGTA CGTGAGAGTA 
CAACCGGGCT TGATCCTTTC AAAATTAAAT GATGAGCTTA AAAAAATCGG CTTCTTCATA 
CCTCCCGAGC CTGCTAGTTC CTTTGCATGT TCCGTGGGAG GAGTAGTCAA TAACGCCTCA 
GGAGGTATGC GAAGTGTAAG GTACGGCACT TTCAGAGACT GGGTGCTTGC CTTAGAGGTG 
GTTTTACCAT CTGGAAAGGT GATAAGAGTT GGTGAGCCGT TCGTCAAGAA TAGAGCCGGG 
TACGACTTAG TTCACCTCTT CGTGGGTAGT GAGGGAACGC TTGGCATAGT GACGGAGATT 
TGGTTCAAGA TCATTCCTGT CCCTGAAGAG GTAAAATACT CGATCATGAT GGAACTGTCT 
GACTTCAGAC AAGGTACCGA GATAATCAGG GAACTTAGAA AGAATCGCGT CGTTATAGAT 
GTGGCAGAAT ATATGGATGG ATTAGTAGCT AAAACAATAA ATAAACATTT TAATACTAAT 
ATACCGGAGA GCGTCGGTGG GACGATTACA CTATCCTCTT CTTCGACTTA TCGAGAAAAA 
ATTGAAAAAG TGTTAAGACA GCACTCTATT ACATTCACAG AGGTGGATGA GGATAAAACT 
CTATCGGAAA GAGCCTTGGC AGGACTGGCC CTAAAGGCTG AGTGGAACGA AAGAGTTTCG 
GAGGACATTG TTGTGCCCCT ATCTAAACTT GATGAAGCTT TTATGAAAAT TAAGGAACTT 
GAGGAAAAGA GCGGCGTTAA GATAGCCATT TTGGGGCACA TAGCTGACGG AAATTTACAC 
CCAAATATTC TGATCTCGAG TAGAGACGAT CCTCGACTTA CGAAAATCTA TGACGAGATA 
GGAAGGATAG CAATAGTACT AGGAGGATCA ATTTCGGGTG AACATGGAAT AGGCTACATG 
AAAGCTGATT TAATGAAGGA ACAGTTAACA GCTCATAACG GCATTGAGGT TCTTAAAATC 
ATGAATGACA TTAAAGGTTG TATCGATCCG CACCACTTTA TGAATCCTGG CAAGTTCGTT 
GAGCTAGCCT GGAGTCGTTA CCTAATTAAT AAGGATTAA

Protein sequence

MWISLSENIL RELDGIKCSL EERTDFLNNR VRPVVVTYPS RTEEVAKIVN IAREHGLPIV 
VWGGGTSLAG HLVCDGCILI DMKFMDKIVE INDTEWYVRV QPGLILSKLN DELKKIGFFI 
PPEPASSFAC SVGGVVNNAS GGMRSVRYGT FRDWVLALEV VLPSGKVIRV GEPFVKNRAG 
YDLVHLFVGS EGTLGIVTEI WFKIIPVPEE VKYSIMMELS DFRQGTEIIR ELRKNRVVID 
VAEYMDGLVA KTINKHFNTN IPESVGGTIT LSSSSTYREK IEKVLRQHSI TFTEVDEDKT 
LSERALAGLA LKAEWNERVS EDIVVPLSKL DEAFMKIKEL EEKSGVKIAI LGHIADGNLH 
PNILISSRDD PRLTKIYDEI GRIAIVLGGS ISGEHGIGYM KADLMKEQLT AHNGIEVLKI 
MNDIKGCIDP HHFMNPGKFV ELAWSRYLIN KD