Gene Amir_1788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_1788
Symbol
ID	8325973
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	1964330
End bp	1965748
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	71%
IMG OID	644942337
Product	beta-galactosidase
Protein accession	YP_003099582
Protein GI	256375922
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.586379
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAGTCCA TTTCCTTTCC CGAGGGCTTC GTGTGGGGGG CCGCGACAGC GGCGTTCCAG 
GTCGAGGGGG CGTCCAAGGA GGACGGTCGC TCCCCTTCCA TCTGGGACAC CTTCTGCGCG 
CTGCCCGGCG CCGTCGCCGG TGGTGACAAC GGTGACGTGG CCGTGGACCA CTACCACCGG 
GTCGAGCAGG ACGTCGCGAT GATGGCGGAC CTCGGCCTCG GCGCGTACCG CTTCTCCACC 
GCCTGGCCGA GGATCCGGCC CGACGGCGGC GAGCCCAACC AGGCCGGGCT GGACTTCTAC 
AGCAGGCTGG TCGACACCCT GCTGGAGCGC GGCATCGACC CGTGGGTCAC GCTCTACCAC 
TGGGACCTGC CGCAGGCCCT GGAGGACGCG GGCGGCTGGG CCAACCGGGA CACCGCGCAC 
CGGTTCGCCG ACTACGCGGC CACGGTCGTG GAGGCGCTCG GCGACCGGGT GTCCAACTGG 
ACCACGCTGA ACGAGCCGTG GTGCTCGGCG TTCCTCGGCT ACGCGGGCGG CATCCACGCG 
CCCGGCCGCC AGGAGCCCGC CGCCGCCGTC GCGGCCGTCC ACCACCTGCT GCTCGGCCAC 
GGCCTCGCCA CCGCGGCGAT CCGCTCGGCC AAGCCGGAGG CCAAGGTCGG CATCACGCTC 
AACATGTACC CGATCATCCC CGCCGACCCC TCGTCCGAGG CGGACCTGGA CGCGGTGCGG 
CGGCTCGACG GGCTGCAGAA CCGGATCTTC CTGGACCCGC TGTTCAAGGG CGAGTACCCG 
GCGGACATCG TCGCTGACCT CGCGCCGTAC GGGTTCGCCG ACCACATCAA GCCCGAGGAC 
CTGGCGATCA TCTCGGCGCC GCTGGACCAG CTCGGCGTGA ACTACTACAC CGAGCACTTC 
GTCAGCTCCG AGCCCGCCGC GCCCAGCGAG CCCAAGCCGG GCCGCCGCGC CACCGGGTCG 
CCGTGGGTCG GGGCCGAGCA CGTCAGCTTC CCGGTCCGGG ACGACGCGAC GCGCACCGAC 
ATGGAGTGGG AGGTGCGACC GCGCGGGATC TACCAGCTCC TCACCCGGCT GCACGAGGAG 
TACCCGCGCC TGCCGATCTA CATCACCGAG AACGGCGCGG CGTACCGCGA CGCGGTGTCC 
GACGACGGCT CGGTCAACGA CCCGGAGCGC CTGGCCTACA TCGACTCGCA CCTGCGCGCG 
GCGCACGACG CGATCACCGA GGGCGTCGAC CTCCGCGGCT ACTTCGCGTG GTCGCTGATG 
GACAACTTCG AGTGGGCCGA GGGTTACGCC AAGCGGTTCG GGATCGTGCA TGTCGACTAC 
GGCACGCAGG TCAGGACGCC TAAGATGAGC GCCATGTGGT ACTCCGAGGT CGCCCGCGGC 
AACGCGCTGC CCGCGCCGTC AGCGACGGCT GCGCCGTGA

Protein sequence

MESISFPEGF VWGAATAAFQ VEGASKEDGR SPSIWDTFCA LPGAVAGGDN GDVAVDHYHR 
VEQDVAMMAD LGLGAYRFST AWPRIRPDGG EPNQAGLDFY SRLVDTLLER GIDPWVTLYH 
WDLPQALEDA GGWANRDTAH RFADYAATVV EALGDRVSNW TTLNEPWCSA FLGYAGGIHA 
PGRQEPAAAV AAVHHLLLGH GLATAAIRSA KPEAKVGITL NMYPIIPADP SSEADLDAVR 
RLDGLQNRIF LDPLFKGEYP ADIVADLAPY GFADHIKPED LAIISAPLDQ LGVNYYTEHF 
VSSEPAAPSE PKPGRRATGS PWVGAEHVSF PVRDDATRTD MEWEVRPRGI YQLLTRLHEE 
YPRLPIYITE NGAAYRDAVS DDGSVNDPER LAYIDSHLRA AHDAITEGVD LRGYFAWSLM 
DNFEWAEGYA KRFGIVHVDY GTQVRTPKMS AMWYSEVARG NALPAPSATA AP