Gene GYMC61_2820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_2820
Symbol
ID	8526697
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	-
Start bp	2879756
End bp	2881612
Gene Length	1857 bp
Protein Length	618 aa
Translation table	11
GC content	58%
IMG OID
Product	squalene/oxidosqualene cyclase
Protein accession	YP_003253881
Protein GI	261420199
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGGCTG ATGAACGAAG TGCGCTCATC GATGCGCTCA AACGGTCGCA AAGCGTCGAC 
GGATCGTGGC GGTTTCCGTT TGAAACCGGC ATTTCCACCG ATGCCTATAT GATCATTTTA 
CTGCGGACGC TCGGAATACA TGATGAACCG TTGATCCAGG CGCTCGTCGA GCGGATCGAA 
AGCCGGCAGG ACGCGAACGG GGCGTGGAAG CTGTTTGCCG ATGAAGGCGA TGGCAATGTG 
ACAGCGACAG TTGAGGCGTA TTATGCCTTG CTTTACTCTG GATATCGAAA AAAAACCGAT 
TCGCATATGC AAAAGGCGAA AGCGCGCATT TTGGAAGTGG GCGGTTTAGA ACGCGTCCAC 
TTGTTTACGA AAGTGATGCT CGCATTGACC GGACAGCACT CGTGGCCAAG ACGGTTTCCG 
CTGCCGCTTG TCTTTTTCCT TCTCCCCCCG TCGTTTCCGC TCAATATGTA TGACCTATCT 
GTATACGGAA GGGCGAACAT GGTCCCGCTT CTTGTCGTCG CGGAGCGCCG CTACAGCCGG 
AAAACGGACA ACAGTCCGGA TCTTTCCGAT TTGGCCGCTT CCCGCAATGA TTGGCGGCTG 
CCGGACACCG AGGCGCTATG GTCGTACGTG AAGCGGTCGC TCACCGGACT TCCCGCTTGG 
CTGCATCGTG CCGCCGAACA GCGCGCCGTC CGCTATATGT TGGAGCATAT CGAGCCGGAC 
GGAACGCTGT ACAGCTATTT CAGCTCGACG TTTTTGTTGA TTTTTGCGCT GCTGGCGCTT 
GGTTATCCAA AAGACGACCC GCATATCGCC CGGGCTGTTC GCGGTTTGCG CTCACTGCGA 
ACCGAAATCG ATGGGCATAC GCATATGCAA TATACAACCG CTTCCGTCTG GAATACGGCG 
TTGGCGAGCT ATGCGCTGCA GGAAGCGGGC GTGCCGCCGA CCGACCGGAC GATTGAGAAA 
GCGAACCGCT ATTTGTTGTC GCGCCAGCAC ATTCGCTACG GCGACTGGGC GGTGCACAAC 
CCGTACGGCG TACCGGGCGG CTGGGGATTT TCCGATGTGA ATACGATGAA TCCGGACGTC 
GACGATACAA CGGCCGCGCT GCGCGCCATC CGCCGGGCGG CAGCGAAAGA GACGGCGTTT 
CGCCATGCAT GGGACCGGGC GAATCGATGG CTGTTTTCGA TGCAAAACGA TGACGGCGGG 
TTTGCGGCGT TTGAAAAGAA CGTAGGCAAA CGGTTTTGGC GGTATTTGCC GATCGAAGGG 
GCGGAGTTTT TATTGATGGA TCCGTCAACA GCCGATTTGA CCGGACGGAC GCTCGAATAT 
TTCGGAACGT TCGCTGGATT AACGAAAGAC CACTCCGCCA TCGCCCGCGC CATCGACTGG 
CTGCTTGACC ATCAGGAAGC CGACGGTTCG TGGTATGGGC GCTGGGGGAT TTGCTATGTG 
TACGGCACAT GGGCGGCGGT GACCGGGCTC TCAGCCGTCG GCGTTCCAAT CGATCACCCG 
GCGATGCAAA AAGCGGTCCG TTGGTTGTTG AGCATCCAAA ACGATGACGG CGGCTGGGGT 
GAATCGTGCA AAAGCGACGG AGCCAAGACG TATGTGCCGC TTGGCGCCAG CACGCCCGTC 
CATACCGCTT GGGCGCTCGA TGCACTGATC GCTGCCGCCG AGCGGCCGAC CCCGGAAATG 
AAAGCCGGCG TTCGCGCCCT AGTCCGTATG CTTCATCACC CGGATTGGAC CGCCTCGTAC 
CCGGTCGGAC AAGGGATGGC CGGCGCCTTT TACATCCATT ACCATGGCTA CCGCTACATT 
TTTCCGCTGT TGGCGCTCGC CCATTACGAG CAAAAGTTCG GACCGTTTGT GGATTAG

Protein sequence

MVADERSALI DALKRSQSVD GSWRFPFETG ISTDAYMIIL LRTLGIHDEP LIQALVERIE 
SRQDANGAWK LFADEGDGNV TATVEAYYAL LYSGYRKKTD SHMQKAKARI LEVGGLERVH 
LFTKVMLALT GQHSWPRRFP LPLVFFLLPP SFPLNMYDLS VYGRANMVPL LVVAERRYSR 
KTDNSPDLSD LAASRNDWRL PDTEALWSYV KRSLTGLPAW LHRAAEQRAV RYMLEHIEPD 
GTLYSYFSST FLLIFALLAL GYPKDDPHIA RAVRGLRSLR TEIDGHTHMQ YTTASVWNTA 
LASYALQEAG VPPTDRTIEK ANRYLLSRQH IRYGDWAVHN PYGVPGGWGF SDVNTMNPDV 
DDTTAALRAI RRAAAKETAF RHAWDRANRW LFSMQNDDGG FAAFEKNVGK RFWRYLPIEG 
AEFLLMDPST ADLTGRTLEY FGTFAGLTKD HSAIARAIDW LLDHQEADGS WYGRWGICYV 
YGTWAAVTGL SAVGVPIDHP AMQKAVRWLL SIQNDDGGWG ESCKSDGAKT YVPLGASTPV 
HTAWALDALI AAAERPTPEM KAGVRALVRM LHHPDWTASY PVGQGMAGAF YIHYHGYRYI 
FPLLALAHYE QKFGPFVD