Gene Bamb_6104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bamb_6104
Symbol
ID	4315008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia ambifaria AMMD
Kingdom	Bacteria
Replicon accession	NC_008392
Strand	-
Start bp	662542
End bp	664590
Gene Length	2049 bp
Protein Length	682 aa
Translation table	11
GC content	70%
IMG OID	638153948
Product	squalene-hopene cyclase
Protein accession	YP_777982
Protein GI	115360845
COG category	[I] Lipid transport and metabolism
COG ID	[COG1657] Squalene cyclase
TIGRFAM ID	[TIGR01507] squalene-hopene cyclase [TIGR01787] squalene/oxidosqualene cyclases

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.640777
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.788384
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGCC GCATGAACAA ATCCGGCCCC TCCCCTTGGT CCGCGCTCGA CGCCGCGATC 
GCCCGCGGAC GCGACGCGCT GATGCGCCTT CAGCAGCCTG ACGGCAGCTG GTGTTTCGAA 
CTCGAATCCG ACGCGACGAT CACCGCGGAA TACATCCTGA TGATGCATTT CATGGACAAG 
ATCGACGACG CGCGCCAGGA GAAGATGGCG CGCTACCTGC GCGCGATCCA GCGGCTCGAC 
ACGCACGGCG GGTGGGACCT GTATGTCGAC GGCGACCCGG ACGTGTCGTG CAGCGTGAAG 
GCGTACTTCG CGCTGAAGGC CGCCGGCGAC AGCGAGCATG CGCCGCACAT GGTTCGCGCG 
CGCGACGCGA TCCTCGAGCT CGGCGGCGCG GCACGCTCGA ACGTGTTCAC GCGCATCCTG 
CTCGCGACGT TCGGCCAGGT GCCGTGGCGC GCGACGCCGT TCATGCCGAT CGAATTCGTG 
CTGTTTCCGA AGTGGGTGCC GATCTCGATG TACAAGGTCG CGTACTGGGC CCGCACGACG 
ATGGTGCCGC TGCTCGTGCT GTGCTCGCTG AAAGCGCGTG CGCGCAACCC GCGCAACATC 
GCGATTCCCG AGCTGTTCGT CACGCCGCCC GACCAGGAAC GCCAGTACTT CCCGCCCGCG 
CGCGGGATGC GCCGCGCATT CCTCGCGCTC GACCGCGTGG TGCGCCATGT CGAGCCGCTG 
CTGCCGAAAC GCCTGCGGCA GCGCGCGATC CGGCATGCGC AAGCATGGTG CGCGGAGCGC 
ATGAACGGCG AGGACGGCCT CGGCGGGATC TTTCCGCCGA TCGTGTACAG CTATCAGATG 
ATGGACGTGC TCGGCTACCC GGACGATCAT CCGCTGCGCC GCGACTGCGA GAACGCGCTG 
GAGAAGCTGC TGGTCACGCG GCCCGACGGC AGCATGTACT GCCAGCCGTG CCTGTCGCCG 
GTGTGGGACA CCGCGTGGAG CACGATGGCG CTCGAGCAGG CGCGCGGCGT GGCCGTGCCG 
GAAGCCGGCG CGCCCGCGAG CGCACTGGAC GAACTCGACG CACGCATCGC CCGCGCGTAC 
GACTGGCTGG CCGAGCGCCA GGTGAACGAC CTGCGCGGCG ACTGGATCGA GAACGCGCCC 
GCCGACACGC AACCGGGCGG CTGGGCGTTC CAGTACGCGA ACCCGTACTA CCCCGACATC 
GACGACAGCG CGGTCGTCAC CGCGATGCTC GACCGCCGCG GCCGCACGCA TCGCAACGCG 
GACGGCTCGC ATCCGTATGC GGCGCGCGTC GCGCGCGCGC TCGACTGGAT GCGCGGGCTG 
CAATCGCGCA ACGGCGGCTT CGCGGCCTTC GACGCCGACT GCGACCGCCT GTACCTGAAC 
GCGATTCCGT TCGCCGATCA CGGCGCGCTG CTCGATCCGC CGACCGAGGA CGTGTCGGGC 
CGCGTGCTGC TGTGCTTCGG CGTCACGAAG CGCGCGGACG ACCGCGCGTC GCTCGCGCGC 
GCGATCGACT ACGTGAAGCG CACGCAGCAG CCCGACGGCA GCTGGTGGGG CCGCTGGGGC 
ACGAACTACC TGTACGGCAC GTGGAGCGTG CTGGCCGGGC TCGCGCTCGC GGGCGAGGAC 
CCGTCGCAGC CGTACATCGC CCGCGCGCTC GCGTGGCTGC GCGCCCGTCA GCACGCGGAC 
GGCGGCTGGG GCGAGACGAA CGACAGCTAC ATCGACCCGG CGCTCGCCGG CACCAATGCG 
GGCGAAAGCA CGTCGAACTG CACCGCGTGG GCGCTGCTCG CGCAGATGGC GTTCGGCGAC 
GGCGAATCGG AATCGGTCAG GCGCGGCATC GCGTATCTGC AATCCGTGCA GCAGGACGAC 
GGCTTCTGGT GGCACCGGTC GCACAACGCG CCGGGCTTTC CGCGCATCTT CTACCTGAAG 
TATCACGGCT ACACGGCGTA CTTCCCGCTG TGGGCGCTCG CGCGCTATCG GCGGTTGGCT 
GGCGGCGTGT CGGCAGCGGG CGCGCACGCG GTGCCGGCGT CCACGGGCGC GGACGCCGCG 
CTCGCCTGA

Protein sequence

MIRRMNKSGP SPWSALDAAI ARGRDALMRL QQPDGSWCFE LESDATITAE YILMMHFMDK 
IDDARQEKMA RYLRAIQRLD THGGWDLYVD GDPDVSCSVK AYFALKAAGD SEHAPHMVRA 
RDAILELGGA ARSNVFTRIL LATFGQVPWR ATPFMPIEFV LFPKWVPISM YKVAYWARTT 
MVPLLVLCSL KARARNPRNI AIPELFVTPP DQERQYFPPA RGMRRAFLAL DRVVRHVEPL 
LPKRLRQRAI RHAQAWCAER MNGEDGLGGI FPPIVYSYQM MDVLGYPDDH PLRRDCENAL 
EKLLVTRPDG SMYCQPCLSP VWDTAWSTMA LEQARGVAVP EAGAPASALD ELDARIARAY 
DWLAERQVND LRGDWIENAP ADTQPGGWAF QYANPYYPDI DDSAVVTAML DRRGRTHRNA 
DGSHPYAARV ARALDWMRGL QSRNGGFAAF DADCDRLYLN AIPFADHGAL LDPPTEDVSG 
RVLLCFGVTK RADDRASLAR AIDYVKRTQQ PDGSWWGRWG TNYLYGTWSV LAGLALAGED 
PSQPYIARAL AWLRARQHAD GGWGETNDSY IDPALAGTNA GESTSNCTAW ALLAQMAFGD 
GESESVRRGI AYLQSVQQDD GFWWHRSHNA PGFPRIFYLK YHGYTAYFPL WALARYRRLA 
GGVSAAGAHA VPASTGADAA LA