Gene Amir_0033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_0033
Symbol
ID	8324178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	36613
End bp	37875
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	73%
IMG OID	644940571
Product	beta-galactosidase
Protein accession	YP_003097853
Protein GI	256374193
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGGAC CTGATTTCCT CTGGGGCGTC TCGACTTCCG CCTTCCAGAT CGAGGGGGGC 
TTCGACGAGG ACGGCAGGCT TCCCTCAGTG TGGGATGAAT TTCCCTCGTT CGAGGGACAG 
ACCGCGCGGG TGGCCTGCGA CCACCGCAAC CGGCACGCCG AGGACGTGGC GCTGCTGCGC 
GAGCTGGGGG TGAACGCGTA CCGGTTCTCG CTGTCCTGGC CCCGCGTCGA GGGCGGACGG 
GCGGCCGGGA GCGGGAGCGC GGCGAGCAGC GGGCTCGACT TCTACGACCG GCTCGTCGAC 
GACCTGCTCG ACGCGGGCAT CGCCCCCGTC GCGACGCTCT ACCACTGGGA CACGCCCGCC 
CACGTGGAGG AGGCGGGCGG CTGGCTCGCG CGGGACACCG CGCACCGGTT AGCCGACTAC 
GCCGCCACCG CCGCCGCCCG GCTGGCCGAC CGGGTCGCGA TGTGGATCCC GGTCAACGAG 
CCCGCCATCG TCACCCTGCT CGGCTACGCC ACCGGGCAGC ACGCGCCGGG CAAGGCGCTC 
CTGTTCGACG CGCTGCCCGC CGCCCACCAC CTCAACCTCG GCCACGGCCT CGCCGTCCAG 
GCCCTGCGCG CGGCGGGGGC CACCTCGGTC GGCACCGCCA ACAACCACAC CCCGGCCTGG 
GCGGCCACCG GCTCCGCCGA GGACGCCGCC GCCGCGAGCG CGTACGCCGA CCTGCACAAC 
TGGCTCTACG CCGACCCGGT CCTCGCCGGG CGCTACCCCG AGTCGCTGGT CGACCTGCTG 
CCGGTCGAGG ACGGCGACCT CGCCACCATC GCCCAGCCGC TCGACTTCTA CGGCGTCAAC 
TACTACAACC CGACCCGGCT CTCGGCCCCG TCGCCGGGCA ACCCGCTGCC GTTCGACCTG 
GTCCCGATCA CCGAGCACCC GGTCACCGGC TTCGGCTGGC CCGTCGTGCC CGCCGGGCTC 
GGCGAGATGA TCGGCGCCCT GCGCACCAGG CACCCGAACC TGCCGCCCGT GCACGTCACC 
GAGAGCGGGT GCAGCTACCC GCACTCGCTC GACGACACCG AGCGCGTCGA CTACCTGGCC 
GCCCACAGCG AGGCCGCGAT CGCCGCGGGG GCGAAGGGCT ACTTCGTCTG GTCGGTGCTG 
GACAACTTCG AGTGGGACTC CGGGTACTCG CAGCGCTTCG GCCTGGTCCA CGTCGACTAC 
GCCACCCAGC GCCGCACCCC GCGCGCCTCC TTCCGCTGGT ACCGCGACCG GATCCGCCGG 
TGA

Protein sequence

MTGPDFLWGV STSAFQIEGG FDEDGRLPSV WDEFPSFEGQ TARVACDHRN RHAEDVALLR 
ELGVNAYRFS LSWPRVEGGR AAGSGSAASS GLDFYDRLVD DLLDAGIAPV ATLYHWDTPA 
HVEEAGGWLA RDTAHRLADY AATAAARLAD RVAMWIPVNE PAIVTLLGYA TGQHAPGKAL 
LFDALPAAHH LNLGHGLAVQ ALRAAGATSV GTANNHTPAW AATGSAEDAA AASAYADLHN 
WLYADPVLAG RYPESLVDLL PVEDGDLATI AQPLDFYGVN YYNPTRLSAP SPGNPLPFDL 
VPITEHPVTG FGWPVVPAGL GEMIGALRTR HPNLPPVHVT ESGCSYPHSL DDTERVDYLA 
AHSEAAIAAG AKGYFVWSVL DNFEWDSGYS QRFGLVHVDY ATQRRTPRAS FRWYRDRIRR