Gene Gbem_3360 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gbem_3360
Symbol
ID	6780218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter bemidjiensis Bem
Kingdom	Bacteria
Replicon accession	NC_011146
Strand	+
Start bp	3861485
End bp	3863527
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	62%
IMG OID	642769351
Product	squalene-hopene cyclase
Protein accession	YP_002140151
Protein GI	197119724
COG category	[I] Lipid transport and metabolism
COG ID	[COG1657] Squalene cyclase
TIGRFAM ID	[TIGR01507] squalene-hopene cyclase [TIGR01787] squalene/oxidosqualene cyclases

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0001243
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCTCCC CTTTCAAGCA CCCCATATCA AACGCACTCA CCTCATTCAA CGGTAACGTT 
GCAGAGCCAG AGCAAAGCGT CGAGCAACAG AGTGGAGCAA AGGTGCACCA CCTTCCTGCT 
TCAATCTGGA AGCGGAAGAT GGGCAGGGCT AAGAGCCCCC TGGATGTGGC CATTGAAGGA 
AGCCGCGATT TTTTCTTTCA GGAACAGCTA CCCAAAGGTT ATTGGTGGGC AGAACTCGAA 
TCCAATGTCA CCATCACCGC CGAATACATC ATGCTGTTCC ATTTCCTTGG GCTGGTTGAT 
CCTGAGCGCC AGCGCAAGAT GTCAACCTAC CTGCTCTCTA AACAGACCGA AGAAGGTTTC 
TGGACCATCT ATTACGGCGG ACCTGGCGAT CTCTCTACCA CCATAGAGGC CTATTTCGCC 
CTGAAACTCT CCGGTTACCC GGAGGACCAC CCGGCCCTGG CGAAGGCGCG CGCCTTCATC 
CTGGAGCAGG GGGGGGTCGT CAAGAGCCGC GTCTTCACCA AGATCTTCCT GGCGCTCTTC 
GGCGAGTTCG ACTGGCAGGG GATCCCGAGC ATGCCGGTTG AGCTGAACCT CCTGCCGGAC 
TGGGCCTACA TCAACATCTA CGAATTCTCC AGTTGGGCCA GGGCGACCAT TGTCCCGCTT 
TCCGTGGTGA TGCACAGCCG CCCGGTGCGC CGCGTCCCCC CTTCCGCGCG GGTACAGGAA 
CTCTTCGTGC GGCAGCCCAC GGCGGCGGAC TACAGCTTCG CCAAAAACGA CGGCCTCTTC 
ACCTGGGAGA AATTTTTCCT AGGTCTCGAC CGCGTGCTCA AGGTGTACGA GAAGAGCCCG 
CTGCGCCCGT TCAAGAAGAC GGCGCTGGCC AAGGCGGAGG AGTGGGTGCT GGAGCACCAG 
GAACCGACCG GCGACTGGGG AGGCATCCAG CCTGCCATGC TGAACGCCAT CCTTGCGCTC 
AACGTGCTGG GGTACCGGAA CGACCACCCC GCGGTGGAAC AGGGGTTGAG GGCGCTGGCG 
AACTTCTGCA TCGAGACCGA GGACCAGCTG GTGCTGCAGT CCTGCGTCTC CCCGGTGTGG 
GACACGGCGC TGGCGTTAAA GGCGCTATTG GATGCGGGCG TTCCTCCCGA CCACCCCTCC 
CTGGTGAAGG GGGCCCAGTG GCTTCTGGAC AAGGAGGTGA CCCGGGCAGG CGACTGGCGC 
GTCAAGTCCC CCAACCTGGA AGCCGGCGGT TGGGCCTTCG AATTCCTGAA CGACTGGTAC 
CCGGACGTGG ACGACTCCGG CTTCGTCATG ATCGCCCTGA AGGGGATCCA GGTGAAGGAC 
CACAAGGCCA TGGACGCCGC CATCAAGCGC GGCATCAACT GGTGCCTGGG GATGCAGAGC 
AAGAACGGCG GCTGGGGGGC GTTCGACAAG GACAACACCA AGCACGTACT GAACAAGATC 
CCCTTTGCCG ATCTGGAGGC GCTCATCGAT CCCCCAACCG CGGACCTGAC CGGCCGCATG 
CTGGAGCTGA TGGGAACCTT CGACTACCCT GTCACCTTCC CTGCGGCGCA GCGCGCCATC 
GAATTCCTGA AGAAGAACCA GGAGCCGGAG GGGCCCTGGT GGGGGCGCTG GGGGGTCAAC 
TACCTTTACG GCACCTGGTC CGTCCTTTGC GGGCTGGCCG CCATAGGCGA AGACATGGAT 
CAGCCTTACA TCCGCAAGGC GGTGAACTGG ATCAAGTCGC GCCAGAACAT CGACGGCGGG 
TGGGGCGAGA CCTGCCAGTC GTACCACGAC CGGACCCTGG CAGGGGTCGG CGAGAGCACC 
CCTTCCCAGA CGGGATGGGC GCTCCTAAGC CTTCTGGCGG CCGGCGAGAT GCACTCGGCG 
ACCGTGGTGC GTGGGGTGCA GTACCTGATC TCGACCCAGA ACAGCGACGG GACCTGGGAC 
GAGCAGCAGT ACACCGGGAC CGGGTTCCCC AAGTACTTCA TGATCAAGTA CCACATCTAC 
CGCAACTGCT TCCCGCTCAT GGCCCTGGGG ACCTACCGCA CCCTGACCAG GACGCAGCCG 
TGA

Protein sequence

MTSPFKHPIS NALTSFNGNV AEPEQSVEQQ SGAKVHHLPA SIWKRKMGRA KSPLDVAIEG 
SRDFFFQEQL PKGYWWAELE SNVTITAEYI MLFHFLGLVD PERQRKMSTY LLSKQTEEGF 
WTIYYGGPGD LSTTIEAYFA LKLSGYPEDH PALAKARAFI LEQGGVVKSR VFTKIFLALF 
GEFDWQGIPS MPVELNLLPD WAYINIYEFS SWARATIVPL SVVMHSRPVR RVPPSARVQE 
LFVRQPTAAD YSFAKNDGLF TWEKFFLGLD RVLKVYEKSP LRPFKKTALA KAEEWVLEHQ 
EPTGDWGGIQ PAMLNAILAL NVLGYRNDHP AVEQGLRALA NFCIETEDQL VLQSCVSPVW 
DTALALKALL DAGVPPDHPS LVKGAQWLLD KEVTRAGDWR VKSPNLEAGG WAFEFLNDWY 
PDVDDSGFVM IALKGIQVKD HKAMDAAIKR GINWCLGMQS KNGGWGAFDK DNTKHVLNKI 
PFADLEALID PPTADLTGRM LELMGTFDYP VTFPAAQRAI EFLKKNQEPE GPWWGRWGVN 
YLYGTWSVLC GLAAIGEDMD QPYIRKAVNW IKSRQNIDGG WGETCQSYHD RTLAGVGEST 
PSQTGWALLS LLAAGEMHSA TVVRGVQYLI STQNSDGTWD EQQYTGTGFP KYFMIKYHIY 
RNCFPLMALG TYRTLTRTQP