Gene Amir_1971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_1971
Symbol
ID	8326156
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	2183048
End bp	2184484
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	68%
IMG OID	644942520
Product	alpha-L-arabinofuranosidase B
Protein accession	YP_003099765
Protein GI	256376105
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000055654
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTCAGTA CCCGGTCCCT GGGCCGCCGG GTGGCGCTGC TCGTCGCGAC CCTGCTGCTA 
GCCGTCGCGC CGCACCAGGC CGCCGCGCGG CAAGCCATCG CGCAGCAAGC CGACCAGCCC 
GCCACCGAGT CCTCGGACCC CACCACGCAG GCGACCTACG CCGCGTACGT GATGGGCTAC 
TTCACCGAGT CCCCCAGCAC CACCGGCGCG AACTACGGCC TGCACCTCGC GGTCAGCGGC 
GACGGCCTCA ACTGGACCCC GCTGGGCCAG AACAACCCCG TCGTCACCCC CACCGCGGGC 
ACCAGGGGCC TGCGCGACCC GTTCATCCTG CGCAAGCAGG ACGGCACGTT CGTGGTCATC 
GCCACCGACC TCAACGGCAC CGACTTCACG CAGAAGAACC AGTACATCCA CGCCTGGGAC 
TCCACGAACC TGACCAGCTT CAGCAACTAC CGCAGGCTGA AGATGCACTC GATGGACACC 
CACACCTGGG CCCCCGAGGC GTTCTACGAC GCGGCGCGCG GCCAGTACGG CATCCTCTAC 
TCCGCGCACA ACGGAACCCG CGACGTCTTC ATGGTCAACT ACACCACCGA CTTCGTGGAC 
GTCGGCTCCC CGCAGGTGTT CTTCGACCCC GGCTTCAACG TCCTCGACGG CACCGTCCTC 
ACCAGCGGCG GCACGAACTA CCTGTACTAC AAGAACATGG CCGACGGGAA CCTGTACGGC 
GCGCGCTCGT CCTCGTTGAA CCCCAACAGC TTCAGCACCT ACACGAGCCC GCTCAAGCAG 
GCGAGCGGCA TCGAGGCGCC GATCCTGGTC AAGTCCAACA CCTCGGACAC CCACTACCTG 
TGGGGCGACT CGTACTCCCC GGTGAACGGC GAGTTCTACG CCTGGTCCAC CACCAACCCC 
GGCGCGAACT CCTGGTCGGT GCTGAACCAG CGCGCCTACA CCCAGCCGCT GAACTCCAAG 
CACGCCACCA TCTCCCCGAT CACGGCGGCC GAGCAGTCCG CGCTGCTGTC CCGCTGGGGC 
GCCCCGTCCT GGAACCGCCT GAAGTCCTCG AACTTCCCGG ACCGATTCGT GCGCCACCAG 
AACTACCTCG GCCGCATCGA CCCGTACCCG TTCGACCCGT ACACCGACCA GCTCTGGAAG 
CTCGTGCCGG GCCTGTCCGA CTCCTCGGGC GTCTCGTTCC AGTCGGTGTC CGACCCGACC 
CGCTACCTGC GGCACTACGA GTACGCGATC CGCTTGGACG CCAACGACAA CACCGCCGCC 
TTCCGCGCCG ACGCGACCTT CCACCGCGTC CCCGGCCTTG CCGACTCGTC CTGGTCCTCG 
TTCCGCTCCG CGAACCTCCC GGACCGCTAC CTGCGGCACT CCGGCTACGC GCTGCGCGTC 
GACCCGATCA GCACGGCCAC CGACCAGCAG GACGCGACCT TCCGCGTCGG CTCCTGA

Protein sequence

MVSTRSLGRR VALLVATLLL AVAPHQAAAR QAIAQQADQP ATESSDPTTQ ATYAAYVMGY 
FTESPSTTGA NYGLHLAVSG DGLNWTPLGQ NNPVVTPTAG TRGLRDPFIL RKQDGTFVVI 
ATDLNGTDFT QKNQYIHAWD STNLTSFSNY RRLKMHSMDT HTWAPEAFYD AARGQYGILY 
SAHNGTRDVF MVNYTTDFVD VGSPQVFFDP GFNVLDGTVL TSGGTNYLYY KNMADGNLYG 
ARSSSLNPNS FSTYTSPLKQ ASGIEAPILV KSNTSDTHYL WGDSYSPVNG EFYAWSTTNP 
GANSWSVLNQ RAYTQPLNSK HATISPITAA EQSALLSRWG APSWNRLKSS NFPDRFVRHQ 
NYLGRIDPYP FDPYTDQLWK LVPGLSDSSG VSFQSVSDPT RYLRHYEYAI RLDANDNTAA 
FRADATFHRV PGLADSSWSS FRSANLPDRY LRHSGYALRV DPISTATDQQ DATFRVGS