Gene Amir_4844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_4844
Symbol
ID	8329042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	5765696
End bp	5767000
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	76%
IMG OID	644945285
Product	Sterol 3-beta-glucosyltransferase
Protein accession	YP_003102517
Protein GI	256378857
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCATTC TCATCTACAC CTACGGGACC AGGGGCGACG TCCAGCCCTA CGTGGCGCTG 
GCGGTCGCGC TCAACGCGCG CGGGCACCAC TGCGTGCTCT CGGCCCCCGC GCGCTTCGCA 
GGGCTCGCCG CCGCGCACGG CGTCGAGTTC GCGGGCCGGG ACGACGAGCT GATCCGGTTC 
TACCTGGAAG ACCCCGAGGT GCAGTACAGC CTCGCCCACC AGGGCAGTGC CGAGCCCGGT 
TTCCGGGCGC GGGGCCGCCG CGCCAGCACC GCCCTGCGCC GCACCCTGGT CGCCCGGCTG 
CCGCACATCC TGCGCGACAC CGCCGCGGCG GCGGAGGGCG GCGCGGACCT GGTCGTCGCC 
GGGCACTACC AGTGGGAGCT GGGCCAGCAC ATCGCCGAGC ACCTGAAGGC GCCGCTGGTG 
ATGACCTCGC TGTGGCCGAC CTGCCTGCCG TCCAGGCGCC ACCCCAGCGA GGTGGTGCCC 
TTCGGCGGCA GCCTCCCGCC GCTGCTCAAC CGGTTGTCCT ACCTGCCCCT GCGCTGGTTC 
CAGGTCGGCG GCGCCGAGGT CGACCGGTGG CGCGCTGACC TGGGCCTGCC CAAGCGCAGG 
GGCAGGCACG ACCGCTCCCG CACGGCGACG GGCGAGCCGG TCCCCTTCGT CCACGGCATC 
AGCCCGCTGG TCGTGCCACC CGCCCCCGAC TGGCCCGCGA ACGCCCACAC CTCCGGATTC 
TGGCGGCTGC CGCCCGCGCC GGACTGGAGC CCGCCCCCGT CCCTCGCCGA CTTCCTCGAC 
CGCGACCCCA AGCCGGTGTT CATCGGCTTC GGCAGCATCG TCAGCCGCGA CCCGGAGGAC 
ACCGCCCGCG TCATCCGCGA GGCCGTCTCC CGAGCAGGGG TGCGCGCCGT GGTGCGGTTG 
GAGGCCAACA TCGACGCCGA CGCGCTCGGC CCCGACGTGC TCCCCGCGGG CGAGGCGCCC 
TACGACTGGC TGTTCCCCCG CGTTGCCGCG ATCGTGCACG GCGGCGGGGT CGGCACGGTC 
AACGACGCCC TCGCCTCGGG CGTGCCCCAG GTGCCCGTCC CGCACACCAG CGAGCAGGAG 
GTCTGGTGCC GGATCGCGCA CCGGCTGGGT GTGGCCACCG AGCCGTTCCG GCAGCGCGAC 
CTGGACGTCG ACCGGCTCGC CACCGCCCTG CGCGCCGCGA CCGGCGACGA GGGCCTGGCC 
CGCGCCGCCC GCTCGGTGGG CGAGCGCGTC CGCGCCGAGG ACGGGGCGGG GACGGCCGCC 
GCACTGGTGG AGCGCTACGG CCTCGACCGG GCGGCCACCC GATGA

Protein sequence

MRILIYTYGT RGDVQPYVAL AVALNARGHH CVLSAPARFA GLAAAHGVEF AGRDDELIRF 
YLEDPEVQYS LAHQGSAEPG FRARGRRAST ALRRTLVARL PHILRDTAAA AEGGADLVVA 
GHYQWELGQH IAEHLKAPLV MTSLWPTCLP SRRHPSEVVP FGGSLPPLLN RLSYLPLRWF 
QVGGAEVDRW RADLGLPKRR GRHDRSRTAT GEPVPFVHGI SPLVVPPAPD WPANAHTSGF 
WRLPPAPDWS PPPSLADFLD RDPKPVFIGF GSIVSRDPED TARVIREAVS RAGVRAVVRL 
EANIDADALG PDVLPAGEAP YDWLFPRVAA IVHGGGVGTV NDALASGVPQ VPVPHTSEQE 
VWCRIAHRLG VATEPFRQRD LDVDRLATAL RAATGDEGLA RAARSVGERV RAEDGAGTAA 
ALVERYGLDR AATR