Gene Amir_1044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_1044
Symbol
ID	8325216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	1157476
End bp	1159557
Gene Length	2082 bp
Protein Length	693 aa
Translation table	11
GC content	74%
IMG OID	644941588
Product	Alpha-galactosidase
Protein accession	YP_003098846
Protein GI	256375186
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3345] Alpha-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGACGAGT CGACGAACGC GGCCGGGGAC GCCCCGGTCG ACCAGGACGG CACGACGGGC 
GACGGCGCGG TGAGCGGCGG GACGGCAGGC GGCAGCTCAG CGGACGACAG CGCGGCGGGC 
AGCGGCGCGG CGGGCAGCGG CGCGGCGGAA ACCGGTGCGC CGCAGGAGAT CAGGCCGCCC 
GCGCTGGCGC CGACTCCCCC GATGGGCTTC AACAACTGGA ACTCCACCCA GTGCGGGCCC 
GAGTTCACCG ACTCGATGAT CCGGGGCATC GCCGACCTCT TCCTCAGCCT CGGCCTCAAG 
GACGCGGGCT ACGAGTACGT CAACATCGAC GACTGCTGGG CGCTGCCGCA GCGCGACGCG 
GACGGCGACC TGGTGCCCGA CCCGGTCCGG TTCCCCGAGG GCATGAAGCC GCTCGTGGAC 
TACGTGCACT CCAAGGGCCT GAAGTTCGGC ATCTACACCA GCGCGGGCAC CAGGACGTGC 
AGCGAGCGCG GGTTCCCCGG CGCGCTCGGG CACGAGCGGC AGGACGCCGC GCTGTTCGCC 
TCCTGGGGCG TGGACTACCT GAAGTACGAC AACTGCCACA ACCAGGGCGT CGACGCGAGG 
CTGCGCTACC GGGCCATGCG CGACGCGATC GCCGCCACCG GCCGCCCGAT CGTGCTGAGC 
GTGTGCGAGT GGGGCGAGAA CCGGCCGTGG GAGTGGGCGT TCGAGGTCGG GCAGCTGTGG 
CGCACCACCC CGGACATCCG GGACAGCTGG GACTCGGTGC TGGAGATCGC CAAGGCGAAC 
ATGGCGCTGG CCGAGCACGC CGGGCCGAAC CGGTGGAACG ACCCGGACAT GCTGGAGGTC 
GGCAACGGCG GCCTGACCTG GGAGGAGTGC CGCACGCACT TCAGCCTGTG GGCGATGATG 
GCCGCTCCCC TGCTGATCGG CGTGGACCTG CGGTCGGTGG CGCCCGAGGC GGTGGAGATC 
CTGACCAACC GCGAGGTGAT CGCGCTCGAC CAGGACCCGC TCGGCGAGCA GGCGCGGGTG 
GTGCGCTCCG AGGACGGGCT GCACGTGCTG GTGAAGCGGC TGCAGGACGG CGGGCGCGCG 
GTGGCGCTGT TCAACGAGAA CGACGTGCCC GCGCGGATCT CGACCAGCGC CGCCGAGGCC 
GGGCTCCCCC GGTCGACCGG GTACCGGCTG CGGGACGTGT GGGCGCGGAC CGACGCGCAC 
TCGGCGGGCG ACGTCACGGC GTGGGTGCCG CCGCACGGCG CGGTCGTCTA CCGGGTGACG 
CCCGAACCGG CGTGGCTGCT GCTGCCGCCC GCCGTGGACG CGGGGGTGGA GCCGGTGCTG 
TCCCGGCCCG GCGCGCTGCC GCTGGTCGAC CCGGACGCCC CGTCGCTGGT GACCACCTCG 
CTGGGCGACA ACGGCTGGCT GCCGGTGCTC GGCGCGCGGG TGGACCTGGA GGCCCCCGCC 
GGGTGGCGGG TGCGGCCGAG GGGGCAGCGG GCCCGGTCGG TGCTCGCGGG CGGGGACCGG 
CTGGACACCA CCTGGGAGGT GCTGCCGCCC GCCGGGCTCG AACCGGGCCG GTACCGGCTG 
ACGGCGCTGT TCGCCTACCT GTACGGGTGG GGGCGGCGGG TGAGCGCGGA CCTGGAGGTG 
GTGGTGCCGC ACCGCCTGCC GTCCGGCACC TCGTACCTGA GCGACGCGCC GTGGCTGCGG 
GCGAGCAACG GGTTCGGGCC GGTCGAGGTC GACACCAGCA ACGGCGAGGC CGAGGCCGGG 
GACGGCGGGC CGCTCACGGT CAACGGGAGG GTGTTCGAGA AGGGCCTCGG GGTGCACGCG 
CCCAGCTCGG TCGAGTACTT CACCGGTGGC CGCTGCACGT CCGTGTCGGC GTTCGTGGGC 
GTGGACGACG AGAAGCCCGC GGCCGGGTCG GTGGTGTTCC AGGTGTGGGC GGATGAGCGG 
AAGGTCGCCG ACAGCGGGGC GCTGACCACG CGGGACGACG CGGTCGAGCT GGTCGCGGAC 
GTGACCGGGG CGCGGACCGT GCGGCTGGTG GTGACCGACG CGGGCAACGG CGTCGACAGC 
GACCACGGTG ACTGGTGCGA CCTGAAGGCC ACCTGCGAGT GA

Protein sequence

MDESTNAAGD APVDQDGTTG DGAVSGGTAG GSSADDSAAG SGAAGSGAAE TGAPQEIRPP 
ALAPTPPMGF NNWNSTQCGP EFTDSMIRGI ADLFLSLGLK DAGYEYVNID DCWALPQRDA 
DGDLVPDPVR FPEGMKPLVD YVHSKGLKFG IYTSAGTRTC SERGFPGALG HERQDAALFA 
SWGVDYLKYD NCHNQGVDAR LRYRAMRDAI AATGRPIVLS VCEWGENRPW EWAFEVGQLW 
RTTPDIRDSW DSVLEIAKAN MALAEHAGPN RWNDPDMLEV GNGGLTWEEC RTHFSLWAMM 
AAPLLIGVDL RSVAPEAVEI LTNREVIALD QDPLGEQARV VRSEDGLHVL VKRLQDGGRA 
VALFNENDVP ARISTSAAEA GLPRSTGYRL RDVWARTDAH SAGDVTAWVP PHGAVVYRVT 
PEPAWLLLPP AVDAGVEPVL SRPGALPLVD PDAPSLVTTS LGDNGWLPVL GARVDLEAPA 
GWRVRPRGQR ARSVLAGGDR LDTTWEVLPP AGLEPGRYRL TALFAYLYGW GRRVSADLEV 
VVPHRLPSGT SYLSDAPWLR ASNGFGPVEV DTSNGEAEAG DGGPLTVNGR VFEKGLGVHA 
PSSVEYFTGG RCTSVSAFVG VDDEKPAAGS VVFQVWADER KVADSGALTT RDDAVELVAD 
VTGARTVRLV VTDAGNGVDS DHGDWCDLKA TCE