Gene BMAA2100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMAA2100
Symbol	shc
ID	3087572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei ATCC 23344
Kingdom	Bacteria
Replicon accession	NC_006349
Strand	-
Start bp	2306239
End bp	2308194
Gene Length	1956 bp
Protein Length	651 aa
Translation table	11
GC content	70%
IMG OID	637565963
Product	squalene-hopene cyclase
Protein accession	YP_106607
Protein GI	53715881
COG category	[I] Lipid transport and metabolism
COG ID	[COG1657] Squalene cyclase
TIGRFAM ID	[TIGR01507] squalene-hopene cyclase [TIGR01787] squalene/oxidosqualene cyclases

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATACGC TCGACGCAAC CGCCGCGCCG GCCGGCCTCG ACGCCGCCGT CGCGCGCGCG 
ACCGACGCGC TGCTCGCCGC GCAGCAAGCG GACGGCCACT GGGTCTACGA GCTCGAAGCC 
GATTCGACGA TCCCGGCCGA ATACGTGCTG CTCGTCCACT ATCTCGGCGA GGCGCCGAAT 
GTCGAGCTCG AGCAGAAGAT CGCGCGCTAT CTGCGCCGGA TTCAGCAGCC GGACGGCGGC 
TGGCCGCTCT TCACCGACGG TGCGCCGAAC ATTAGCGCGA GCGTGAAGGC GTACTTCGCG 
CTGAAGGTGA TCGGCGACGA CGAGAACGCC GAGCACATGC AGCGCGCGCG CCGCGCGATC 
CACGCGATGG GCGGCGCGGA GATGTCGAAC GTGTTCACGC GGATTCAGCT CGCGCTGTAC 
GGCGTCGTGC CGTGGTACGC GGTGCCGATG ATGCCGGTCG AGATCATGCT GCTGCCGCAG 
TGGTTCCCGT TCCATCTATC GAAGGTGTCG TACTGGGCGC GCACCGTGAT CGTGCCGCTG 
CTCGTGCTGA ACGCGAAGCG CCCGGTCGCG AAGAATCCGC GCGGCGTGCG CATCGACGAG 
CTGTTCAAGG GCGCACCCGT CAGCACCGGC CTGCTGCCGA AGCAGCCGCA CCAGAGCGCC 
GGCTGGTTTG CGTTCTTCCG CGCGGTCGAC GGGGTGCTGC GTCTCGTCGA CGGCCTCTTC 
CCGCGCTATA CGCGCGAGCG CGCGATCCGC CAGGCGGTCG CGTTCGTCGA CGAGCGCCTG 
AACGGCGAGG ACGGGCTCGG CGCGATCTAT CCCGCGATGG CCAACGCGGT GATGATGTAC 
GCGGCGCTCG GCTATCCCGA AGATCATCCG AACCGCGCGA TCGCGCGCCG CTCGATCGAG 
AAGCTGCTCG TCGTCGGCGA GCAAGAGGCG TATTGCCAGC CGTGCCTGTC GCCGGTATGG 
GACACGTCGC TTGCCGCGCA TGCGCTGCTC GAGACGGGCG ACGCGCGCGC GCGCGAAGCG 
GCGGTGCGCG GCCTCGACTG GCTCGTGCCG CGGCAGATCC TCGACGTGCG CGGCGACTGG 
ATCTCGCGCC GTCCGCACGT GCGCCCCGGC GGCTGGGCGT TCCAGTACGC GAATGCGCAC 
TATCCGGACG TCGACGACAC GGCGGTCGTC GCGATGGCGA TGGACCGCGT CGCGAAGCTC 
GACCGGACCG ACGCGTATCG CGAGTCGATC GCGCGCGCGC GCGAGTGGGT TGTCGGCATG 
CAGAGCAGCG ACGGCGGCTG GGGCGCGTTC GAGCCGGAAA ACACGCAGTA CTACCTGAAC 
AACATTCCGT TCTCCGATCA CGGCGCGCTG CTCGATCCGC CGACGGCCGA CGTGTCGGGC 
CGCTGCCTGT CGATGCTCGC GCAGTTCGGC GAGACGAGCG CGTCGAGCGA GCCCGCGCGC 
CGCGCGCTCG ACTACATGCT CAAGGAGCAG GAGCCGGACG GCAGCTGGTA CGGCCGCTGG 
GGGATGAACT ACATCTACGG CACGTGGACC GCGCTGTGCT CGCTGAACGC GGCGGGCCTC 
GGCCACGACG ATCCGCGCGT GAAGCGCGCC GCGCAATGGC TGCTGTCGAT CCAGAACGCC 
GACGGCGGCT GGGGCGAGGA CGGCGACAGC TACAAGCTCG ACTACCGCGG CTACGAGCGC 
GCGCCGAGCA CGTCGTCGCA GACCGCGTGG GCGCTGCTCG GCCTGATGGC GGCGGGCGAA 
GTCGACAATC CCGCCGTCGC GCGCGGCGTC GATTACCTGC TCGGCACGCA GCGCGAGCAC 
GGCCTGTGGG ACGAGACGCG CTTCACCGCG ACGGGCTTCC CGCGCGTGTT CTATCTGCGC 
TACCACGGCT ACCGCAAGTT CTTCCCGCTG TGGGCGCTCG CCCGCTATCG CAACCTGAAG 
CGCGCGAACG CGATGCGCGT GACGGTCGGG ATGTAA

Protein sequence

MHTLDATAAP AGLDAAVARA TDALLAAQQA DGHWVYELEA DSTIPAEYVL LVHYLGEAPN 
VELEQKIARY LRRIQQPDGG WPLFTDGAPN ISASVKAYFA LKVIGDDENA EHMQRARRAI 
HAMGGAEMSN VFTRIQLALY GVVPWYAVPM MPVEIMLLPQ WFPFHLSKVS YWARTVIVPL 
LVLNAKRPVA KNPRGVRIDE LFKGAPVSTG LLPKQPHQSA GWFAFFRAVD GVLRLVDGLF 
PRYTRERAIR QAVAFVDERL NGEDGLGAIY PAMANAVMMY AALGYPEDHP NRAIARRSIE 
KLLVVGEQEA YCQPCLSPVW DTSLAAHALL ETGDARAREA AVRGLDWLVP RQILDVRGDW 
ISRRPHVRPG GWAFQYANAH YPDVDDTAVV AMAMDRVAKL DRTDAYRESI ARAREWVVGM 
QSSDGGWGAF EPENTQYYLN NIPFSDHGAL LDPPTADVSG RCLSMLAQFG ETSASSEPAR 
RALDYMLKEQ EPDGSWYGRW GMNYIYGTWT ALCSLNAAGL GHDDPRVKRA AQWLLSIQNA 
DGGWGEDGDS YKLDYRGYER APSTSSQTAW ALLGLMAAGE VDNPAVARGV DYLLGTQREH 
GLWDETRFTA TGFPRVFYLR YHGYRKFFPL WALARYRNLK RANAMRVTVG M