Gene Mpop_1835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpop_1835
Symbol
ID	6312724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium populi BJ001
Kingdom	Bacteria
Replicon accession	NC_010725
Strand	+
Start bp	1973399
End bp	1975402
Gene Length	2004 bp
Protein Length	667 aa
Translation table	11
GC content	68%
IMG OID	642650558
Product	squalene-hopene cyclase
Protein accession	YP_001924533
Protein GI	188581088
COG category	[I] Lipid transport and metabolism
COG ID	[COG1657] Squalene cyclase
TIGRFAM ID	[TIGR01507] squalene-hopene cyclase [TIGR01787] squalene/oxidosqualene cyclases

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.807169
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAGAGG CGGCCGTGAG CAAGGTCGAG ACGCTGCAGC GTCCCAAGAC CCGCGACGTG 
TCCCTCGACG ATGTCGAGCG TGGCGTCCAG AACGCCGCCC GCGCCCTCAC CGAGATGACG 
CAGACCGACG GCCACATCTG CTTCGAGCTC GAAGCGGATG CGACCATCCC CTCCGAATAC 
ATCCTGTTCC ACCAGTTCCG CGGAACCGTG CCGCGCGACG GCCTGGAAGC CAAGATCGGC 
AACTACCTGC GCCGCACGCA GTCGAAGGTG CATGGCGGCT GGGCGCTGGT CCATGACGGC 
CCGTTCGACA TGAGCGCGAC CGTGAAGGCC TATTTCGCCC TCAAGATGAT CGGCGACGAC 
ATCGAGGCGC CGCACATGCG CGCGGCCCGC AAGGCGATCC TGCAGCGCGG GGGCGCGGCC 
AACGCCAACG TCTTCACTCG CATCCTGCTC GCCCTCTACG GCGAGGTGCC CTGGGCCGCG 
GTGCCGGTGA TGCCGGTGGA GGTGATGCAC CTGCCGAAGT GGTTCCCGTT CCACCTCGAC 
AAGGTGTCCT ACTGGGCCCG CTGCACCATG GTGCCGCTGT TCGTGATCCA GGCCAAGAAG 
CCGCGGGCGA AGAACCCGCG CGGCATCGGC GTGGCCGAAC TGTTCGTGAC CCCGCCCGAT 
TCGGTGCGGA CCTGGCCGGG CTCGCCCCAC GCCACTTGGC CGTGGACGCC GATCTTCGGC 
GCCATCGACC GCGTGCTGCA GAAGACGCAG GACCACTTCC CGAAAGTGCC GCGCCAGCGC 
GCCATCGACA AGGCGGTGGC CTGGGTGTCC GAGCGCCTGA ACGGCGAGGA CGGCCTCGGC 
GCCATCTTCC CGTCGATGGT CAACTCGGTG CTGATGTACG AGGTGCTCGG CTATCCCCCC 
GATCATCCGC AGGTGAAGAT CGCGCTGGAA GCCATCGAAA AGCTCGTCGC CGAGAAGGAC 
GACGAGGCCT ATGTCCAGCC CTGCCTGTCG CCGGTCTGGG ACACGGCGCT GACCAGCCAC 
GCCATGCTGG AGACCGGCGG CGCCGCGGCC GAGGCCAATG CCCGCGCCGG CCTCGACTGG 
CTGAAGCCGC TGCAGATCCT CGACATCAAG GGCGACTGGG CCGAGACCAA GCCGAACGTG 
CGCCCCGGCG GCTGGGCCTT CCAGTACGCC AACCCGCACT ATCCCGATCT CGACGACACC 
GCCGTGGTGG TGATGGCGAT GGACCGCGCC CAGCGCCAGC ACGGTCTGGT GAGCGGAATG 
CCGGACTACT CGGCCTCGAT CGCCCGCGCC CGCGAGTGGG TCGAGGGGCT CCAGAGCGCC 
GACGGCGGCT GGGCGGCCTT CGACGCCGAC AACAACCACC ACTACCTCAA CCACATCCCG 
TTCTCGGATC ACGGCGCGCT GCTCGATCCG CCGACCGCGG ACGTGACCGC CCGCGTCGTC 
TCGATGCTGT CGCAGCTCGG CGAGACCCGC GAGACCAGCC GGGCGCTCGA CCGCGGTGTG 
ACCTACCTGC TCAACGACCA GGAGAAGGAC GGGAGCTGGT ACGGCCGCTG GGGCATGAAC 
TTCATCTACG GCACGTGGTC GGTGCTCTGC GCGCTGAACG CCGCCGGTGT CGATCCGCAA 
TCGCCTGAGA TCCGCAAGGC GGTGGCGTGG CTCATCCGCA TCCAGAACCC GGATGGCGGC 
TGGGGCGAGG ATGCCTCCTC CTACAAGCTC AACCCCGAAT TCGAGCCGGG CTACTCCACC 
GCCTCGCAGA CGGCCTGGGC GCTGCTCGCC CTCATGGCGG TGGGCGAGGT GGACGATCCG 
GCGGTCGCCC GCGGCGTCAA CTACCTGATG CGCACGCAAG GGCAGGACGG GTTGTGGAAC 
GAGGAGCGCT ACACCGCGAC CGGCTTCCCG CGGGTGTTCT ACCTGCGCTA CCACGGCTAC 
CCGAAATTCT TCCCGCTCTG GGCGATGGCC CGCTTCCGCA ACCTGAAGAA GGGTAACAGC 
CGTCAGGTGC AGTTCGGGAT GTGA

Protein sequence

MREAAVSKVE TLQRPKTRDV SLDDVERGVQ NAARALTEMT QTDGHICFEL EADATIPSEY 
ILFHQFRGTV PRDGLEAKIG NYLRRTQSKV HGGWALVHDG PFDMSATVKA YFALKMIGDD 
IEAPHMRAAR KAILQRGGAA NANVFTRILL ALYGEVPWAA VPVMPVEVMH LPKWFPFHLD 
KVSYWARCTM VPLFVIQAKK PRAKNPRGIG VAELFVTPPD SVRTWPGSPH ATWPWTPIFG 
AIDRVLQKTQ DHFPKVPRQR AIDKAVAWVS ERLNGEDGLG AIFPSMVNSV LMYEVLGYPP 
DHPQVKIALE AIEKLVAEKD DEAYVQPCLS PVWDTALTSH AMLETGGAAA EANARAGLDW 
LKPLQILDIK GDWAETKPNV RPGGWAFQYA NPHYPDLDDT AVVVMAMDRA QRQHGLVSGM 
PDYSASIARA REWVEGLQSA DGGWAAFDAD NNHHYLNHIP FSDHGALLDP PTADVTARVV 
SMLSQLGETR ETSRALDRGV TYLLNDQEKD GSWYGRWGMN FIYGTWSVLC ALNAAGVDPQ 
SPEIRKAVAW LIRIQNPDGG WGEDASSYKL NPEFEPGYST ASQTAWALLA LMAVGEVDDP 
AVARGVNYLM RTQGQDGLWN EERYTATGFP RVFYLRYHGY PKFFPLWAMA RFRNLKKGNS 
RQVQFGM