Gene Nmag_0401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_0401
Symbol
ID	8823223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	394725
End bp	396062
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	63%
IMG OID
Product	Hydroxymethylglutaryl-CoA synthase
Protein accession	YP_003478551
Protein GI	289580085
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGCAG TCGGTATCGA TGCCATCGAG ATCTGGACCG GGAACCTCAA ACTCGACCTT 
CCCGGGACGT TCGCGCCGCA GAAGGGCGAA GACCCCGAAA AGTACACGAA AGGGCTCGGC 
CTCAACGCGA GTTCGTTCCC CGACAGTTAC GAGGACATCG TCACCATGGG CGCAAACGCG 
GCCCACCGCC TGATGGAGCG CAAGGGCCTC GAACCCGACG ATATCGGCCG TATCGACGTC 
GCAACCGAGA GCTCGTTCGA CAACTCGAAG CCAGTTTCGA CGTACGTCGC TGGCTGCCTC 
GAATCAGTCT ACGACGGCGA CTTCCACCAC GCGAACAAGG GCGAGCGCAA GTTCGCCTGC 
ATCGCCGGCA CGCAGAGTCT GGACGACGCG TTCAACTGGA TCCGTGCGGG TCGCAACCGC 
GGCCGCGGCG CGCTCGTCAT CGCCACTGAC ACCGCACTCT ACGCCCGCGG CGACGCCGGC 
GAGGCAACCC AGGGCGCGGG TGCCGTCGCG ATGTACATCG ACGAAGACCC CGACCTGATC 
GAACTCTCCG CCGAACAGGG CTACGGCTCG GCCGACGAAA CCGACTTCCT CAAACCGAAT 
CAGCAGTTCC CCTCGGTCGA CGGCAAGCGC TCCGTGCAGG TCTACCTCGC ACGCATGCGT 
GAAGCTCTGG AGGACTACGA GAGCGTCGCG GGCGACGTCC ATCCCGACGA TTTCGTGTTC 
GCGCCGTTCC ACACGCCGTT CCCAGGTATG GTGCGCAAGG CAGCGATGCT CGCGTATCGC 
CACGTTACGC GTGATACGGC GGTCGAAGAG GAACTCGCCG AAGAGATCGG TCGACAGCCC 
CGTAGAGAGG CGTTCGACGA CGAAGAGGCG TTCCGCGATG CCGTTCGCGA GTACATGGAC 
GCGCTCAAGG AGACCGACCG GTACCAGGAG TGGTACGCCG AGACGATCGA TCCCACACTG 
GCGCTCTCGC GTGAGGTCGG CAACTGGTAC ACTGGTTCGG TTCACATCGC CCGCGCAAGC 
GCGCTGAAGC AGGCCCTCGA GTCCGGTCGC GATCTGACGG GCGAGACGCT ACTGATCGGC 
TCCTACGGGA GCGGTGCGCA GGCCGAGATT CACTCAGAAA TCGTCCAAGA CGGCTGGGAG 
GAAGAAATCG AGGCGCTGAA CGTCGACGAG CAACTCGAGG CGCGCTACGA TATGGACTGG 
GCGGATTACG AGCAGATCCA CGACGCGCAC AACCACGAGA TGGACATCGA CGTCGAGGAG 
TTCACGACGC CCGAAGACGA GTTCGTCTTC GACGGCTGGG GTCGGATGGG CGAGCGGAAA 
TACCGCTACG TCGAGTAA

Protein sequence

MTAVGIDAIE IWTGNLKLDL PGTFAPQKGE DPEKYTKGLG LNASSFPDSY EDIVTMGANA 
AHRLMERKGL EPDDIGRIDV ATESSFDNSK PVSTYVAGCL ESVYDGDFHH ANKGERKFAC 
IAGTQSLDDA FNWIRAGRNR GRGALVIATD TALYARGDAG EATQGAGAVA MYIDEDPDLI 
ELSAEQGYGS ADETDFLKPN QQFPSVDGKR SVQVYLARMR EALEDYESVA GDVHPDDFVF 
APFHTPFPGM VRKAAMLAYR HVTRDTAVEE ELAEEIGRQP RREAFDDEEA FRDAVREYMD 
ALKETDRYQE WYAETIDPTL ALSREVGNWY TGSVHIARAS ALKQALESGR DLTGETLLIG 
SYGSGAQAEI HSEIVQDGWE EEIEALNVDE QLEARYDMDW ADYEQIHDAH NHEMDIDVEE 
FTTPEDEFVF DGWGRMGERK YRYVE