Gene Msed_0623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0623
Symbol	aksA
ID	5105595
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	572096
End bp	573229
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	48%
IMG OID	640506527
Product	trans-homoaconitate synthase
Protein accession	YP_001190722
Protein GI	146303406
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR02090] isopropylmalate/citramalate/homocitrate synthases

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTCTCCA CTAGAAGAGT TAGAATATTT GATACAACTT TGCGTGACGG AGAGCAAGCT 
CCTGGGATAG ATCTTACCAT AGATCAGAAA GTGAGGATAG CAAGGCAGTT GCAAAGGCTA 
GGAGTAGACA CGATAGAGGC AGGGTTTCCA GCATCTTCAG AGGGCGAGTT CATCGCAACC 
AAGAAGATCA TAGAGGAAGT GGGAGACTCC GTTGAGGTCA CAGGTCTTGC TAGGGCAAAT 
AAGAACGATA TTGACAAGGG TATAGAGGCA GGTCTTTCAA GCATCCATGT GTTCATTGCC 
ACCTCGGACG TGCATCTTAA GTATAAGTTG AAAATGACGA GAGAACAGGT AATAGACAGG 
ATCTATGAAT CCGTGAGGTA CGCAAAATCT CACGGCCTGA TAGTGGAGTA CAGCCCTGAG 
GACGCTACGC GAACGGAGGA AGAGTTCCTA TTGCAGGCTG TTAAAACCGC AGTTGAGGCT 
GGCGCTGATA GGATAAATAT ACCAGATACC GTTGGGGTAA TGCATCCCTT CAAGTTCCAG 
GAAGTAATTA GGAAAGTAGT TTCTGTAGCT TCGGGGAGGA TCATAAGTGT TCATTGCCAC 
AATGACTTTG GATTGGCTAC AGCGAACTCC ATAGCCGGTG TTGTGGGCGG AGCTAGACAG 
GTACATGTTA CAGTTAATGG TATAGGGGAG AGGGCCGGGA ACGCATCCCT TGAGGAAGTG 
GTGATGGCCC TGAAGAAGCT CCTAGATTAC GAGGTTGGAG TCAAGCCCTG GTTACTTTAT 
GACACCAGTA AGCTTGTATC AGAGCTTACG GGTGTTCCAG TCCCGTTCTT CAAGGCGGTA 
GTAGGGGACA ATGCTTTTGG ACATGAGGCC GGGATCCACG TTCATGGTGT TATAGAAAAT 
CCGCTCACCT ACGAGCCCAT GTCACCTGAG GAAGTCGGCA ACTTCAGGAG ACTTGCCTTG 
GGTAAACATA GCGGAATACA TGGGCTTAGA AAGATCCTTG AGGACCAGGG TATATACCTG 
GATGACGAGA AGTTAAAGGT AGTGTTGAGC GAAGTTAAGA AGATGGCAGA TACTGGTCAT 
AGGGTAAGTG CAGAGGACGC GAAGAGGATA GCATCTAGAT TTTTGAGCTC CTGA

Protein sequence

MFSTRRVRIF DTTLRDGEQA PGIDLTIDQK VRIARQLQRL GVDTIEAGFP ASSEGEFIAT 
KKIIEEVGDS VEVTGLARAN KNDIDKGIEA GLSSIHVFIA TSDVHLKYKL KMTREQVIDR 
IYESVRYAKS HGLIVEYSPE DATRTEEEFL LQAVKTAVEA GADRINIPDT VGVMHPFKFQ 
EVIRKVVSVA SGRIISVHCH NDFGLATANS IAGVVGGARQ VHVTVNGIGE RAGNASLEEV 
VMALKKLLDY EVGVKPWLLY DTSKLVSELT GVPVPFFKAV VGDNAFGHEA GIHVHGVIEN 
PLTYEPMSPE EVGNFRRLAL GKHSGIHGLR KILEDQGIYL DDEKLKVVLS EVKKMADTGH 
RVSAEDAKRI ASRFLSS