Gene Msed_1220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1220
Symbol
ID	5103834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	1193651
End bp	1195030
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	52%
IMG OID	640507112
Product	vinylacetyl-CoA Delta-isomerase
Protein accession	YP_001191305
Protein GI	146303989
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2368] Aromatic ring hydroxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAGCA AGGAGGAATT CGTGAATGGG TTAAGGGATA AGAGGAAGGT TTTCTATCGT 
GGAAAGTTGA TCGATCCCAC AGAGCATCCC ATTATAAAGG TAGCCGTTTC TCACGCCTCT 
AAGTTGTTTG AGTATCCTGG AAGAGTAGAC CAGGAAGGAA AAAGCAAGTT CTTTCATGTC 
CCAAGGAACA GTCAAGATCT CATGGAGAGA CACGGTCTGA TATACGGGCT CACCATGTAC 
TGTAACGGGA TATTTAACAT ATCCCAGGCG ATTGGTAGCG ACGCCCTTTT CGCGCTACTT 
ATTACCTCGA GGAGAGTGGA CAGGGAGAGG GGAACGGACT ACACGAAAAG GGTCGAGAAC 
TATCTAACCC ACGTGAGGGA TAAGGACCTT ACCATAGCGA CGGCCCAAAC GGACGTCAAG 
GGGGATAGGT CCAAGAGACC AAAGGAGCAG GGGGATCCCG ACATGTACCT GAGGGTCAAG 
GAGGTGAGAA GCGACGGTAT AGTGGTTAGA GGAGCAAAGG CCCACACCAC ACAGGCTGCC 
GTCTCAGATG AGATAATAGT GATCCCCACG AGGGCCATGC GCGAAGAGGA AAAGGAGTAT 
GCCGTGGCGT TTGCCGTGCC AGCCAACACC CAAGGGCTCA GGATGTACGT GAGACCCATA 
GATGAACTGG AGGGAAACTC ATCTGCAGTC CTCTCCAGGC AGGACTATGA GCTTGAGACC 
TTAACCGTTT TCGATGACGT ATTTGTGCCC TGGGATAGGG TGTTCCTATT TCAGGAGAGC 
AAGTTCGCGG GTCAGCTCGC CACACTTTTC GCCACCTTCC ATAGGTTCAC AGCCCTCTCG 
TACAGGGTAG CAACTGCCAA TCTCTTCCTA GGGGCAGCAA GGCTTGCGTC CTTCGTTAAC 
GGAATTCAGA ACGAAAAGCA GGTCAGGGAC GACATAGTGG ACATGATAAT GTACAAGGAG 
GTAATGAGGG CAACAGCCCT GTCGGCTGCC ATGTCTCCAG TGATCGAGGA AGGGGTGGCT 
ATCCCGAACC CAGTCTTCAC CAACGTGGGT AAGCTCTACT CCAACGCCCA CTTCCACGAC 
GTGGTCAGGG ACCTCATAGA TGTCTCGGGT GGGATAATCG CGACGATGCC CTCAGAGGAG 
GACCTGACAG GGGAGGGAAG GGAGGAGATC ATGAAGTACT TGAGGGGAGC CGTGGATGGG 
AAAGAAAGGA CTCAGGTGTT GAAGATTGCG AAGGAGCTTG GATCCAGTAA CTTCACGGGG 
TATATTCTAA CTCTCATGAT TCACGCGGAG GGCTCAATGG AGGCCAGCAA GATAGAGTTA 
TACCGAGGAT ATGACTTCTC GGACTCTGAG AAACTGGTGA AATCCCTTCT AAACCGTTAA

Protein sequence

MRSKEEFVNG LRDKRKVFYR GKLIDPTEHP IIKVAVSHAS KLFEYPGRVD QEGKSKFFHV 
PRNSQDLMER HGLIYGLTMY CNGIFNISQA IGSDALFALL ITSRRVDRER GTDYTKRVEN 
YLTHVRDKDL TIATAQTDVK GDRSKRPKEQ GDPDMYLRVK EVRSDGIVVR GAKAHTTQAA 
VSDEIIVIPT RAMREEEKEY AVAFAVPANT QGLRMYVRPI DELEGNSSAV LSRQDYELET 
LTVFDDVFVP WDRVFLFQES KFAGQLATLF ATFHRFTALS YRVATANLFL GAARLASFVN 
GIQNEKQVRD DIVDMIMYKE VMRATALSAA MSPVIEEGVA IPNPVFTNVG KLYSNAHFHD 
VVRDLIDVSG GIIATMPSEE DLTGEGREEI MKYLRGAVDG KERTQVLKIA KELGSSNFTG 
YILTLMIHAE GSMEASKIEL YRGYDFSDSE KLVKSLLNR