Gene Amir_3106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_3106
Symbol
ID	8327296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	3585645
End bp	3587291
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	73%
IMG OID	644943626
Product	Ricin B lectin
Protein accession	YP_003100866
Protein GI	256377206
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3345] Alpha-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0930028
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGTTC GCTCGCGCAG ACGATTAACG ACCCTGCTCC TGGCCGCGCT CGCCGCGCTG 
ACCGGGGTGA CCGCGCCCAC CGCGCACCCC CCGGCGCAGG CCGCCCCCGG AAGCCCCGCG 
CTGACCCCGC CGCTGGGCTG GAACAGCTGG AACAGCTTCG GCTGCGGCAT CACCGAGGGC 
CAGGTGCGCC AGGCCGCCGA CGCGATGGCG TCCTCCGGGA TGCGGGACGC CGGCTACCGC 
TACGTGGTCG TGGACGACTG CTGGTTCGAC CCGCAGCGCG ACAGCGCGGG CAACCTGCGC 
AACCACCCGA CGAAGTTCCC CTCCGGCATG AAGGCGCTGG GCGACTACAT CCACGGCAAG 
GGCCTGAAGT TCGGCATCTA CCAGGCCCCC AACGAGAAGA CCTGCGCCCA GGGCACAGGC 
GCGCACCCCG GCGCCACCGG CAGCAAGGGC CACGAGGCGC AGGACGCCCG CTCGTTCGCC 
TCCTGGGGCG TGGACTACCT GAAGTACGAC TGGTGCTCCG GCGCGGGCAC CCGCGACGAG 
CAGATCGCCC GGTTCACGAT CATGCGCGAC GCGCTGCGCG CCACCGGCCG CCCGATCGTC 
TACAGCATCA ACCCCAACAG CTTCCACGCC ATCACCGGCG ACAAGCACGA CTGGGGCGAC 
GTCGCGGACC TGTGGCGCAC CACCGAGGAC CTGCTGGACG TGTGGCAGAA CGGCAACACC 
AACAGCTACC CGATGGGCGT GGGCAACGTC CTGGACGTCA CCGCGCCGCT GGCCGCCCAG 
ACCGGCCCCG GCAACTGGAA CGACCCCGAC ATGCTCGTCG TCGGCAGGCC GGGGCTCACC 
CTGACCGAGT CCCGCGCGCA CTTCGCGCTG TGGGCGCTGA TGGCCGCGCC GCTCATGGCG 
GGCAACGACA TCCGCACCAT GTCCCCCGAG ATCAGCGCGG TGCTGCGCAA CCCCGGTCTG 
ATCGCGGTCA ACCAGGACCC GCTGGGCGCG GGCGGTCGCC GGGTGCGCGA CGACGGGGCC 
ACCGAGGTGT TCGCCAAGCC CCTGTCCGAC GGGTCGGTCG CGGTCGGCCT GTTCAACCGG 
GGCGGCGGCG CCACCACCGT CGCCACCACG GCCGCGCAGA TCGGGTTGTC CGGCACCGGG 
TTCACCCTCA CCGACCTGTG GACCGGCGGC ACGTCCACCA GCTCGGGCGC GATCTCGGCG 
ACCGTGCCCG CCCACGGCGT CGCCGCCTTC CGCGTCACCG GCGGAACCCC GCTGGCGGCC 
ACCACCTCGC GGCTGCGCGG GACCGGCTCG GGCCGCTGCC TGGACGTGGA CAACGCCTCC 
ACGGCGGCGG GCGCGACCGT GCTGGTCTGG GACTGCCACA CCGCCGCCAA CCAGCTCTGG 
ACGACCTGGG CGGGCGGCGA GGTGCGGGTG TTCGGCGACA AGTGCCTGGA CGCCTACGAG 
CAGGGAACGG TCAACGGCAC GCGCGTGGTG ACCTGGCCGT GCAACGGGCA GGACAACCAG 
CGGTGGGTCG TCGGCTCGGA CGGCTCGGTG CGCAACACCC GCGCCGGGCT GTGCCTGGAC 
GTCGACGGCG CGGGCACGGC GAACGGCACG CGGCTGGTGC TGTGGACGTG CAACGGGCAG 
GGCAACCAGC GGTGGTCCCG GACCTGA

Protein sequence

MPVRSRRRLT TLLLAALAAL TGVTAPTAHP PAQAAPGSPA LTPPLGWNSW NSFGCGITEG 
QVRQAADAMA SSGMRDAGYR YVVVDDCWFD PQRDSAGNLR NHPTKFPSGM KALGDYIHGK 
GLKFGIYQAP NEKTCAQGTG AHPGATGSKG HEAQDARSFA SWGVDYLKYD WCSGAGTRDE 
QIARFTIMRD ALRATGRPIV YSINPNSFHA ITGDKHDWGD VADLWRTTED LLDVWQNGNT 
NSYPMGVGNV LDVTAPLAAQ TGPGNWNDPD MLVVGRPGLT LTESRAHFAL WALMAAPLMA 
GNDIRTMSPE ISAVLRNPGL IAVNQDPLGA GGRRVRDDGA TEVFAKPLSD GSVAVGLFNR 
GGGATTVATT AAQIGLSGTG FTLTDLWTGG TSTSSGAISA TVPAHGVAAF RVTGGTPLAA 
TTSRLRGTGS GRCLDVDNAS TAAGATVLVW DCHTAANQLW TTWAGGEVRV FGDKCLDAYE 
QGTVNGTRVV TWPCNGQDNQ RWVVGSDGSV RNTRAGLCLD VDGAGTANGT RLVLWTCNGQ 
GNQRWSRT