Gene Mnod_7146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_7146
Symbol
ID	7304688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	+
Start bp	7228948
End bp	7230939
Gene Length	1992 bp
Protein Length	663 aa
Translation table	11
GC content	70%
IMG OID	643604700
Product	squalene-hopene cyclase
Protein accession	YP_002502189
Protein GI	220926887
COG category	[I] Lipid transport and metabolism
COG ID	[COG1657] Squalene cyclase
TIGRFAM ID	[TIGR01507] squalene-hopene cyclase [TIGR01787] squalene/oxidosqualene cyclases

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGAAAGG TCGAGACGCT GCACCGCATG AGCACGCAGG ACATCACGCT GGACGATGTC 
GAGCGGCGCG TGTCGCTCGC GTCCAAGGCT CTGATGCGGC TCGCCGGCCC CGACGGGCAT 
TGGTGCTTCG AGCTGGAGGC CGACGCCACC ATCCCGTCCG AGTACATTCT CTATCATCAT 
TTCCGCGGCT CGATCCCCTC CGCGGAGCTC GAGGGCAAGA TCGCCAATTA CCTGCGCCGC 
ACGCAGAGCG CGCAGCACGA CGGCTGGTCC CTCGTCCATG ACGGCCCGTT CGACATGAGC 
GCGACCGTCA AGGCGTATTT CGCCCTCAAG ATGATCGGCG ATTCGATCGA GGCGCCGCAT 
ATGCGCCGCG CCCGCGAGGC GATCCTGCGC CGGGGCGGCG CCGCGCACGC CAACGTCTTC 
ACCCGGACCC TTCTGGCCCT CTACGGCGAG GTGCCGTGGA GCGCCGTGCC GGTAATGCCC 
GTCGAGGTGA TGCTGCTGCC GCGGTGGTTC CCCTTCCACC TCGACAAGGT GTCCTACTGG 
GCCCGCACCG TGATGGTGCC GCTCTTCGTG CTGCAGGCCA AGAAGCCGCG GGCCAGGAAT 
CCGCGGGGCA TCGGCATCCA GGAGCTGTTC GTCGAGCCGC CGGAGCGGGT GAAACGCTGG 
CCGGCCGGCC CGCAGGAATC CTCGCCGTGG CGCCCGGTCT TCGCCGCCAT CGACAAGGTG 
CTGCAGAAGG TCGAGGGCTC GTTCCCGGCG GGCTCCCGTG CCCGGGCGAT CGACAAGGCG 
GTGGCCTTCG TCAGCGAGCG CCTGAACGGC GAGGACGGGC TCGGCGCGAT CTTCCCCGCG 
ATGGTCAACG CGGTGCTGAT GTACGAGGCG CTCGGCTACC CCGAAGATCA CCCCCTGGTC 
GCGACCGCCC GCTCCTCGGT GGAGAAGCTC GTCACCGTCA AGGAGCACGA GGCCTACGTG 
CAGCCCTGCC TGTCGCCGGT CTGGGACACG GCGCTCTCGG CCCATGCGCT CATGGAGGCG 
GGCGGCGTCG AGGCGGAGCG GCACGCCAAG CGCGCCCTCG ACTGGCTCAA GCCCCTGCAG 
GTGCTCGACA TCAAGGGCGA CTGGGCCGCC TCCAAGCCGA ATGTGCGGCC GGGCGGCTGG 
GCCTTCCAGT ACGCCAACCC GCATTATCCG GACCTCGACG ACACCGCCGT GGTGGTGATG 
GCGATGGACC GGGCGCAGGT GCGCCGCAGC CCCGGCCCGG ACGCGGCCGA TTACGGTCAG 
TCGATCGCGC GGGCGCGCGA ATGGGTCGAG GGCCTGCAGA GCCGCGACGG CGGCTGGGCG 
GCCTTCGACG CGGACAACAC CTACCATTAC CTCAACTACA TCCCGTTCTC CGATCACGGG 
GCGCTGCTCG ACCCGCCGAC CGCCGACGTG ACGGCGCGCT GCGTCTCGAT GCTGGCGCAG 
CTCGGTGAGA CGCGCGAGAG CTGCCCGCCC CTCGACCGGG GCGTCGCCTA CCTGCTGGCC 
GACCAGGAGG CGGATGGCAG CTGGTATGGC CGCTGGGGCA TGAACTACAT CTACGGCACC 
TGGTCGGTGC TCTGCGCGCT GAACGCCGCT GGGGTCGACC CGGCCTCGGA GCCGGTGCGG 
CGGGCGGTGA ACTGGCTCAC CACCATCCAG AACCCGGATG GCGGCTGGGG CGAGGACGCG 
GCGAGCTACA AGCTCGAATA TCGCGGCTAC GAGCGGGCGC CGAGCACCGC CTCGCAGACC 
GCCTGGGCGC TCCTCGGGCT CATGGCCGCG GGCGAGGCGG ACAGCCCGGC AGTGGCGCGA 
GGCATCAACT ACCTGACCCG CAGCCAGGGG GCGGACGGGC TCTGGACCGA GGACCGCTAT 
ACGGCGACCG GGTTCCCGCG CGTCTTCTAC CTGCGCTATC ACGGCTACGC GAAGTTCTTC 
CCGCTCTGGG CGCTTGCCCG CTACCGCAAC CTCCAGCAGA GCAACAGCCG TCGGGTCGCC 
GTCGGGATGT GA

Protein sequence

MGKVETLHRM STQDITLDDV ERRVSLASKA LMRLAGPDGH WCFELEADAT IPSEYILYHH 
FRGSIPSAEL EGKIANYLRR TQSAQHDGWS LVHDGPFDMS ATVKAYFALK MIGDSIEAPH 
MRRAREAILR RGGAAHANVF TRTLLALYGE VPWSAVPVMP VEVMLLPRWF PFHLDKVSYW 
ARTVMVPLFV LQAKKPRARN PRGIGIQELF VEPPERVKRW PAGPQESSPW RPVFAAIDKV 
LQKVEGSFPA GSRARAIDKA VAFVSERLNG EDGLGAIFPA MVNAVLMYEA LGYPEDHPLV 
ATARSSVEKL VTVKEHEAYV QPCLSPVWDT ALSAHALMEA GGVEAERHAK RALDWLKPLQ 
VLDIKGDWAA SKPNVRPGGW AFQYANPHYP DLDDTAVVVM AMDRAQVRRS PGPDAADYGQ 
SIARAREWVE GLQSRDGGWA AFDADNTYHY LNYIPFSDHG ALLDPPTADV TARCVSMLAQ 
LGETRESCPP LDRGVAYLLA DQEADGSWYG RWGMNYIYGT WSVLCALNAA GVDPASEPVR 
RAVNWLTTIQ NPDGGWGEDA ASYKLEYRGY ERAPSTASQT AWALLGLMAA GEADSPAVAR 
GINYLTRSQG ADGLWTEDRY TATGFPRVFY LRYHGYAKFF PLWALARYRN LQQSNSRRVA 
VGM