Gene Msed_1647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1647
Symbol
ID	5104852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1588715
End bp	1589797
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	55%
IMG OID	640507538
Product	Acetyl-CoA acetyltransferase-like protein
Protein accession	YP_001191726
Protein GI	146304410
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTTT TCGTTGCCAC AGGATCTACC CTGAGGGTTG ATAGGTATTA TGAGAATAGC 
CTCCTGGACC TCGCCATAGC TGCGGTCTCG GAGCTCGAGG AGGAGCTTAG CGAGCACAAA 
CCCGACGTTC TCCTACTGGC CAACGCCTAT GGTGAAAGTA CCGAGGAGCA GGTTCAGCTC 
GCGGGGAAAC TTGCAAGAGC CCTAGGTTAC AGAATCCCAG CTATCCGTGT CGAGAACGGA 
GACGCAAGCG GAGGATCTGC AATCTACTCC GCTTACTCCC TAGTGAAGTC GGGCACGGCT 
AAGTCAGTGT TGGTGGTTGG AGCCGAGAAA CTCGGCGATT TCCCCGCATC TCACCTGAAC 
GACATACTGG CTGAGAACCT AGATGAGGAG TTCTCCTACA GGGCCGGGGT AATCCCTCAG 
GCCTTCGCTG CAATCCAGAT GAAGCTCTAC ATGAGGAGGT ACAACGTTCC CAGGGAGTAC 
TTCGCTGAGT GGCCCTATCT CATGCACAAG TATGCCTCTG AGAATCATTA CGCTTACCTG 
AAATTCCCCG TGGATAAGGA GACGATCCTT TCCTCACAGG TTGTGTCTGA CCCGCTCAGG 
CTCTTCGACA CGGCTGCGAG GGCAGACGGA GCCTCAGCAG TCCTGATCAC GAACGAAGAG 
GTCGCGAGGA AGGTTAGCGA GGCACCTGTG AAGATAGAAG GGGTTAGCTT CTCAACTGCT 
GGGGTTAACC TGAGGGAATT GCTCTCCGTT AGGGATGCCG TATCCCCATG GAGGGAGTTT 
AAGCCTGACT TCTACGAAAT CCACGATTCC TACAGTGTTA CCGCGGCCAT GATCCTAGAC 
GAGCTAGGTC TTGAGAGGGG AAAATCCCTT CTTCACCTTG ATCAAGTTCA GGTTAACTAC 
TCCGGAGGCC TAAAGGCAAG AGGTTACCCG GGAGGCGCCA CGGGAGTTTA CCAGGTTGCT 
GAGGGATATG CCCAGCTCAC GGGGACATTC AAGGGGAGAA GGGTTAAGGA CGCAAGGAGG 
GGGCTCGTTG TATCCATGGA CGACCTGGGT TCAGTTGCGG TTACCGTAGC TCTTTCGAGG 
TGA

Protein sequence

MNVFVATGST LRVDRYYENS LLDLAIAAVS ELEEELSEHK PDVLLLANAY GESTEEQVQL 
AGKLARALGY RIPAIRVENG DASGGSAIYS AYSLVKSGTA KSVLVVGAEK LGDFPASHLN 
DILAENLDEE FSYRAGVIPQ AFAAIQMKLY MRRYNVPREY FAEWPYLMHK YASENHYAYL 
KFPVDKETIL SSQVVSDPLR LFDTAARADG ASAVLITNEE VARKVSEAPV KIEGVSFSTA 
GVNLRELLSV RDAVSPWREF KPDFYEIHDS YSVTAAMILD ELGLERGKSL LHLDQVQVNY 
SGGLKARGYP GGATGVYQVA EGYAQLTGTF KGRRVKDARR GLVVSMDDLG SVAVTVALSR