Gene Msed_0703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0703
Symbol
ID	5105309
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	639975
End bp	641267
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	48%
IMG OID	640506607
Product	isocitrate dehydrogenase
Protein accession	YP_001190802
Protein GI	146303486
COG category	[C] Energy production and conversion
COG ID	[COG0538] Isocitrate dehydrogenases
TIGRFAM ID	[TIGR00183] isocitrate dehydrogenase, NADP-dependent, prokaryotic type

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0523745
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAAC CCCTCATCAT CCAAAAAGTT AAAAGTTGTT CGAACTACCT AACTTTCATG 
TCGCATGTCC CGGACGATGG TGAAAAAATC TCGTTCCAAA ACGGGAGATG GATAGTTCCC 
AACAAACCTG TCATTCTCTA TATCGAGGGA GACGGTATAG GACCCGAGAT TGTGACCTCT 
GCGAGACAAG TAGTGGACAA GGCTGTGGAA AAGGCCTATG GCTCCAAGAG GGAGATCAAG 
TGGGTTGAGG TACTAGCTGG CGATAAGGCC TTCGCGAAGA CAGGGGATAG GTTTCCCAAG 
GAGACCCAGG AGATGCTCCT GAACTACAGG GTAGTGGTTA AGGGTCCCCT CGAGACTCCC 
ATTGGAAAGG GATGGAAATC CGTGAACGTG GCCATCAGGC TCATGCTGGA CCTTTACGCA 
AACATTAGGC CGGTGAAGTA TATAGATGGA CTCGAGTCTC CGCTAAAGGA ACCAAACAAG 
GTGGACATGA TCATTTTCAG GGAAAACACA GACGACCTAT ATAGGGGTAT AGAGTACACA 
TACGACAGCG AGGAGGCCAA GAAGATAAGG TCATTCCTTA AGAACGAGTT ACACGTTGAT 
GTAGAGGACG ATACTGGAAT TGGTATCAAG GTAATAAGCA AGTTCAAGAC CGAGAGGATC 
ACGAGGATGG CCATGAATTA CGCCATTGAA CACGGAAGGA GAAAGTTAAC CATAATGCAC 
AAGGGGAACG TGCTCAAGTA CACTGAGGGA GCTTTTAGGG ATTGGGCCTA CGACCTTATC 
AAGAGAGAGT ACAGGGACAA GGTAGTGACG GAGGAGGAAA TCATGAAGGA CTACAACGGT 
AAAGCTCCTG AGGGAAAAAT AGTGGTGAAT GACAGGATAG CTGACAACAT GTTCCAACAG 
ATTATCACGA GACCAGATGA GTACGACGTC ATTCTAGCTC CCAACCTTAA TGGAGATTAC 
ATATCCGACG CGGCCGGAGC TCTTATAGGA AACATTGGTA TGCTTGGCGG GGCCAACATA 
GGCGACTCGG GTGGAATGTT TGAGGCAATA CACGGCACTG CCCCCAAGTA CGCAGGAAAG 
AACATGGCGA ATCCCACGGG AATAATTAAG GGATGCGAAC TTATGTTAAG ATTCATGGGG 
TGGAACGAGG CTGCAGATCT AGTGGAGAAG TCCGTGTTGA GGGCCGTCTC CGCCAAGAGG 
GTTACTCAGG ATCTTGCTAG GTTTATGGGA GTTAAGGCCT TGAGTACCAC TGAGTTCACA 
AAGGAACTTA TCAATATCAT GGACACCCTC TAA

Protein sequence

MSEPLIIQKV KSCSNYLTFM SHVPDDGEKI SFQNGRWIVP NKPVILYIEG DGIGPEIVTS 
ARQVVDKAVE KAYGSKREIK WVEVLAGDKA FAKTGDRFPK ETQEMLLNYR VVVKGPLETP 
IGKGWKSVNV AIRLMLDLYA NIRPVKYIDG LESPLKEPNK VDMIIFRENT DDLYRGIEYT 
YDSEEAKKIR SFLKNELHVD VEDDTGIGIK VISKFKTERI TRMAMNYAIE HGRRKLTIMH 
KGNVLKYTEG AFRDWAYDLI KREYRDKVVT EEEIMKDYNG KAPEGKIVVN DRIADNMFQQ 
IITRPDEYDV ILAPNLNGDY ISDAAGALIG NIGMLGGANI GDSGGMFEAI HGTAPKYAGK 
NMANPTGIIK GCELMLRFMG WNEAADLVEK SVLRAVSAKR VTQDLARFMG VKALSTTEFT 
KELINIMDTL