Gene Msed_0830 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0830
Symbol
ID	5105191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	759193
End bp	760440
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	51%
IMG OID	640506735
Product	3-isopropylmalate dehydratase large subunit
Protein accession	YP_001190929
Protein GI	146303613
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR01343] homoaconitate hydratase family protein [TIGR02086] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGGTA CATTAACTGA AAAAATACTT TCAAGGGCGT CAGGAAAAAC TGTTTCGCCC 
GGTGACGTCA TAGAGGCAAA GACTGACATA GTGGCCTTCC ACGACCTAAC GGGATATCAC 
GTAATTGAGG TAATGGAGAA GGCTAACATG ATGAAGATCT TCGATAAGAC AAAAATAGTT 
GTAGCCTTCG ACCACTTGGC ACCGCCACCT GACGTCAGAA GCGCAGAGAT CCAAGGTAAC 
ATAAGGAAGT TCGTGAAGGA GATGAGACTA CCTAACTTTC ATGATATTAA CGTGGGCATT 
CTTCACGAGC TTCTCATAGA ACAATACGCC CTACCTGGTC AGGTGATTGT GGCTGCCGAC 
AGTCACACGA CAACCTCTGG TGCCGTGGGA GCGTTTGCCC AGGGAATGGG AGCAAGCGAC 
GTTGCTGCCG CCGTGATCAC GGGTAAAACT TGGCTAGTGG TTCCTCAGCC CTTCAAGGTA 
ACCCTCAAGG GAAACCCCGG TAAGTGGATA AATGGAAAGG ATGTAGCCCT AGAGTTGCTG 
GGTAAGTTCA AGGCTGATTA CTTTAACGGA ATGTCCATAG AGGTTCACGT CGAGAACCCC 
AAGGCTTTCC CCATGGACTA TAGGGCGACG GTCTCCAACA TGGGGATAGA GATGAACGCT 
GATGCCCTCA TGTTTGTCCC TGACGTCGAG ACCAAGGATT ACATAAAGAC CATGAGGGGG 
AAGGAAGTTG AGCTCGTGAC CCCAGATCCT GGGGCAAAGT ATCTAGATGA GCACACAATT 
GAGCTAGACA AACTGGAACC GCTTGTGGCT GCGCCCTACA GCGTAGACAA CGTTAAGACC 
GCAAGGGAGG AGTCCAAGGT CCCAGTGGAT CAGGTCTACA TCGGTTCCTG TACCAACGGT 
AGGCTATCAG ACTTCAGGAT TGCGTCGGAG ATCCTCAAGG GGAAGAAGGT CAAGACCAGG 
TGTATAGCCA TTCCCTCTTC CTACACGATG TTTAAGCAGG CCATGGAAAT GGGTTACATC 
GAAGACCTAG TTAATGCTGG ATGTGTGGTG ACCTACGGTA CCTGCGGGCC ATGTCTAGGC 
GGTCACTTCG GAGTCGCTGG TCCAGGGGAG GTTATAGTTT CCACGAGCTC CAGGAACTTC 
AGGGGTAGGA TGGGGAGCAA CGAGGCTAAG GTCTACCTGT CCGGGCCTTC GGTTGCGGCT 
GCCTCAGCAG CTACAGGGTA CATAACTGAT CCGAGGGATG TGCAATGA

Protein sequence

MTGTLTEKIL SRASGKTVSP GDVIEAKTDI VAFHDLTGYH VIEVMEKANM MKIFDKTKIV 
VAFDHLAPPP DVRSAEIQGN IRKFVKEMRL PNFHDINVGI LHELLIEQYA LPGQVIVAAD 
SHTTTSGAVG AFAQGMGASD VAAAVITGKT WLVVPQPFKV TLKGNPGKWI NGKDVALELL 
GKFKADYFNG MSIEVHVENP KAFPMDYRAT VSNMGIEMNA DALMFVPDVE TKDYIKTMRG 
KEVELVTPDP GAKYLDEHTI ELDKLEPLVA APYSVDNVKT AREESKVPVD QVYIGSCTNG 
RLSDFRIASE ILKGKKVKTR CIAIPSSYTM FKQAMEMGYI EDLVNAGCVV TYGTCGPCLG 
GHFGVAGPGE VIVSTSSRNF RGRMGSNEAK VYLSGPSVAA ASAATGYITD PRDVQ