Gene Amir_4385 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_4385
Symbol
ID	8328582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	5182451
End bp	5184133
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	75%
IMG OID	644944847
Product	Prenyltransferase/squalene oxidase
Protein accession	YP_003102080
Protein GI	256378420
COG category	[I] Lipid transport and metabolism
COG ID	[COG1657] Squalene cyclase
TIGRFAM ID	[TIGR01787] squalene/oxidosqualene cyclases

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTCGG TCCACGTCGA CCCGGACCCG TTCACGGACG TCCTAGACCG CGCCATCTCC 
GAGGGCGCCG AGGCCCTGTT CCGCGCCCAG CGCCCGGACG GCGTGTTCGA CTACAGCGAG 
GACAACCTCA CCTCCACCCT CGGCACCGTC GGCGCCCTGT CCGCCCTGCA CTACGCCGAC 
CCCGAGGGCA GCGCCGACCT GATCGAGGCG GGCGCGGGCT GGTTGCGCCG CACCCAGAAC 
GAGGACGGCG GCTGGGCCAT GGTCCCCGGC CTGCCCAGCG AGGCGGGCCC CACCGCCGTC 
TCCTCCGCCG TGCTGCACCT GGTCGACCCG GTCGGCAGCG CCGCCCACGT CGAGTCCGGG 
CAGCGCTGGA TGGGCGACCA CGGCGGCCTG GAGGCCATCC CGCACCCCGA GGTCGTCTCC 
TGGTGCCGCC AGTACTACGG CTTCGTCGGC TGGCTCGCCC CCGAGGACAT GCGCCGCTTC 
CCCCTGGAGC TGGCGCTGCT GCCCGGCCTC TACCGCAGGC TCTTCGACCT GCGCGTCCCC 
ATGGCCTCCG CGCTCGGCCT GGCCCAGGCC AAGCACAAGC CGCTCAACCC GCTGCAGCGC 
CTGTTCGCCC GCCTCGGCAC GCCGAACGCG CTCACCGCCA TCCGCCAGGT CTACGAGCAC 
GAGGGCTCCA CCGGCGCGTG GTGCGAGAAC GCCTGGGTCA CCGGCCTGGT CTGCACCGGC 
CTCGCCCGCG CCGACCTCGC CCCCGACATG GTCGCCGCCG CCGTCGGCTG GTTCCGCCGC 
ACCATGGACC CCGACGGCTG GTGGCAGACC GGCCCGCTCG ACGCCGCCTG GACGATGTAC 
GCGGTGCGCG GCCTCACCGA GGTCGGCTAC GCCGACGACC CCCGGCTCGT CGCCTCCAGG 
GACCTGTTCA CGCGCCTGCA GCAGCACCGC CCGTTCCTGG CGTTCGGCTG CCCGCCCGGC 
TACTGGGGCT GGGCGGGCAC CGAGGGCTGG CCGTCCACGC TGGAGACCGG CGAGATCCTG 
TCCGTGCTGT GCAGGCTCCC CGGCGACGAG CAGGCGCACT CGGTCGAGCG CGGCGTCGAC 
TGGCTCACCC GCGTGCAGGA CACCCGCGGC TCCTGGGGCC TGTGCGTGAA GAACACCAAG 
GTCGCCAACA GCGGCCCGTG CCCCATGACC ACCGTGCAGG CCGTCGACGC GCTGCTCGAC 
GCGGGCGTGC CCGCCACCGA CCCCAGGGTG CGCCGCGCCC TGACCTGGCT GGGGAAGGCC 
CAGCTGCCGG ACGGCTCGTT CGAGTCGGTC TGGTACCGCC AGCACACCAT GGGCACCGCC 
GCCGTCCTGG AGACCTTCTC CAGGGTCGGC CGCGCCGACG ACCCGGTCGC CCGCAAGGCC 
GTGGCCTGGT TGGAGCGCGC CCGGCTCGAC GACGGCTCCT GGGGCGACGG CGCGGGCGCG 
CCCGGCACGG TCGAGGAGAC CGGCTGGGCG GTGTCGGCGC TGCTCGCCTC CGGCGCGGAC 
GCGGCCGGTC TGCGCACCGG CGTCGACTGG CTGCTCGCCC ACCGCGCGGA CGGCGGCGGG 
TGGCCCTCGG AGATCGTCCA CGAGTACGTG CGGCACGTCA GCCGCTACAC CAACCCCGCG 
TTCGCCCAGG GCATGGCGCT GCGCGCGCTG GGCCGCTACC GGGACGCGGT CGCCAAGCCC 
TGA

Protein sequence

MTSVHVDPDP FTDVLDRAIS EGAEALFRAQ RPDGVFDYSE DNLTSTLGTV GALSALHYAD 
PEGSADLIEA GAGWLRRTQN EDGGWAMVPG LPSEAGPTAV SSAVLHLVDP VGSAAHVESG 
QRWMGDHGGL EAIPHPEVVS WCRQYYGFVG WLAPEDMRRF PLELALLPGL YRRLFDLRVP 
MASALGLAQA KHKPLNPLQR LFARLGTPNA LTAIRQVYEH EGSTGAWCEN AWVTGLVCTG 
LARADLAPDM VAAAVGWFRR TMDPDGWWQT GPLDAAWTMY AVRGLTEVGY ADDPRLVASR 
DLFTRLQQHR PFLAFGCPPG YWGWAGTEGW PSTLETGEIL SVLCRLPGDE QAHSVERGVD 
WLTRVQDTRG SWGLCVKNTK VANSGPCPMT TVQAVDALLD AGVPATDPRV RRALTWLGKA 
QLPDGSFESV WYRQHTMGTA AVLETFSRVG RADDPVARKA VAWLERARLD DGSWGDGAGA 
PGTVEETGWA VSALLASGAD AAGLRTGVDW LLAHRADGGG WPSEIVHEYV RHVSRYTNPA 
FAQGMALRAL GRYRDAVAKP