Gene Msed_1693 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1693
Symbol
ID	5105339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1630961
End bp	1632040
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	48%
IMG OID	640507587
Product	myo-inositol-1-phosphate synthase
Protein accession	YP_001191772
Protein GI	146304456
COG category	[I] Lipid transport and metabolism
COG ID	[COG1260] Myo-inositol-1-phosphate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.23989
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAAGA TAGCAATCGC TGGCCTTGGA AATTGTGCAT CCATGCTTGT GCAAGGAATA 
GAATACTACA GGAAAATGGG CGAGAATTAC TTTGATGGAT TGATTACACC CATCATAGGC 
GGTTACAAGG TAACTGACAT CAAGGTAGTA GCTGCCTTTG ATGTCTCAGT CAACAAGATA 
GGAAAAGATG TGGCTGAGGC GATATTTGAG AAGCCTAACA TAACTCCTAG AATAGTTGAG 
ATGGACAAGT TGGGAGTTGA GGTCTCTCCA GGTCCTGTAT TGGATGGCGT TGCCCCACAC 
ATGATGAACG TGTTTAATCC CTCAAGCGAG GGGAAGATTG AGTCCGTTGT GGATGAACTG 
AAAAGTAGTG GAGCAGATCT GCTCGTCAAC ATGTTGCCAG TGGGTAGCGA GATGGCCTCG 
AGGGCATATG CGAGGGCATC ACTTGAGGCC AGAATAGGGT TTGTTAACGC TATCCCCGTC 
TTCATAGCGA GTGACCCCAC AGGTGAATTC CCAAGGAGGT TCAGAGAGCT TGGATTACCC 
ATTGCTGGTG ACGACGTGAA GGGACAAGTT GGCGCAACCA TATTTCATAG GGCCATCACC 
TCGCTATTCA GATTAAGGGG GGTTAAGGTA GAGGAGACAT ATCAGCTAAA CGTAGGAGGA 
AACACGGATT TCCTCAACAT GAAGACTGAG GAGAGGCTCC ACTCCAAGAG GATCAGCAAG 
ACCAAGGCCG TAACGAGTAC CCTTGATAAT GAGCAGGAAA TAGAGACCCA AGGAAGGATA 
AGGATAGGGC CCAGCGATTA CGTTCCATTC CTGGGAAACA CTAAGGTGGC ATACATCTAC 
GTTAACGGGT CTGGGTTTGC TGGAAGGCCA GTGAAGGTGG AGGCAACCCT AGAGGTTGAC 
GATAAGGCTA ACTGTGCCTC AGTACTGGTA GATGTAATAA GGGCAGTGAA GTTAGCCAAG 
GACAGGGGAA TAGGAGGCCC CCTGAACGAG GTTTCTGCGT TCTACTTCAA ACATCCACCT 
AAGCAGGCTA AGGATGATGA GGAGGCCTAT CTTTGGTTTA AGAAATTCAT TGAAATGTGA

Protein sequence

MIKIAIAGLG NCASMLVQGI EYYRKMGENY FDGLITPIIG GYKVTDIKVV AAFDVSVNKI 
GKDVAEAIFE KPNITPRIVE MDKLGVEVSP GPVLDGVAPH MMNVFNPSSE GKIESVVDEL 
KSSGADLLVN MLPVGSEMAS RAYARASLEA RIGFVNAIPV FIASDPTGEF PRRFRELGLP 
IAGDDVKGQV GATIFHRAIT SLFRLRGVKV EETYQLNVGG NTDFLNMKTE ERLHSKRISK 
TKAVTSTLDN EQEIETQGRI RIGPSDYVPF LGNTKVAYIY VNGSGFAGRP VKVEATLEVD 
DKANCASVLV DVIRAVKLAK DRGIGGPLNE VSAFYFKHPP KQAKDDEEAY LWFKKFIEM