Gene Amir_1858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_1858
Symbol
ID	8326043
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	2048069
End bp	2049586
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	72%
IMG OID	644942407
Product	Alpha-N-arabinofuranosidase
Protein accession	YP_003099652
Protein GI	256375992
COG category	[R] General function prediction only
COG ID	[COG3940] Predicted beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCACGC TCGACCGCAG GTCACTGCTG CGCGCCGGAG GGGCGCTCGC CGCCGCGAGC 
ACGCTCCCCG CGCTCGGCGC CACCACCGCG TCGGCCCAGG AGCCGGCGAG AACCGCTGCC 
GCGCAGGGGG TCTCGGCGCA GGCCGTCCCC GGCCAGGCGG CCATCGACGT CACGCCCGCG 
CTCCCCACCC GCAGCCCGCT GGTCGAGCAG CGCGCCGACC CGTTCGTCAC CCCGCCCACC 
GACGGCATGT ACTACCTGAC CGGCTCGGTC CCGGAGTACG ACCGCATCGT CATCCGGGGC 
GCGTCCACCC TCGACGGCCT GACGACCGCC CGCGAGCGCA CCATCTGGCG GCGGCCGACC 
TCCGGCAAGC TGGGCGGCTA CATCTGGGCG CCGGAGCTGC ACCGCATCGA CGGCAAGTGG 
TACGTCTACT TCGCCGCGGG CGACTCGGAC GAGCCGTTCC GCATCCGCAC CTACGTCCTC 
GAATCGGCCA ACGCCGACCC GCGCGCCGAC GGCTGGGTGC TGCGCGGGCA GGTGACCACC 
GCCTGGGACA CCTTCACCCT GGACGCCACC ACGTTCGAGC ACCGGGGCAA GCGGTACTTC 
CTGTGGGCGC AGAGCGAACC GGGCATCGCC ACCAACAGCA ACCTCTACAT CGCCGAGATG 
GCCTCCCCGC TCGCCCTCAA GTCCGCGCCG GTCCGGATCG CCGTCCCCAC GCTGAGCTGG 
GAGATCCAGG GCTTCAAGGT GAACGAGGGC GCCGCGGTGC TGATCCGCAA CGGCCGGGTG 
TTCGTCACCT ACTCGGCCAG CGCCACCGAC TCCCGCTACT GCATGGGCCT GCTCACCGCC 
GACGAGAACG CGAACCTGCT CGACGCGCGC TCGTGGACCA AGTCGCAGAC CCCGATCTTC 
ACCACCAACA CCGAGACCGG CCAGTACGGG CCCGGCCACA ACTCGTTCAC CACGGTCGAC 
GGCGCGGACG TCATGGTCTA CCACGCCCGC GACTACCGGG ACATCACCGG CGACCCGCTG 
TTCGACCCGA ACCGGCACGC CCGCGTGCAG CGGGTGCACT GGAACGACGA CGGCACCCCG 
TCGTTCGGCG TCCCGGTCGG CAAGGGCGGC CCCATCAGCC GCCTGTCGCC GCTCGACGCG 
CCGACCCTGT TCGTGCGGCA CTACGACTAC AAGCTGCGGG TGGACGGCAA CGTGCGCACC 
GTCGCCGACT CGCAGTTCCG CTTCGTGCCG GGCTTCTTCG GCGCGGGCAC GGTCGCGCTC 
CAGTCGGTCA ACTACCCCAA CCGGTACGCG CGGGTGGTCG ACGGCGTGAC CATCCGAGTC 
GACCCGTACG AGGACAGCGA CGCCTACGGG CGCGCGGCCA GCTTCGTCCG GGTCGAGGGG 
CTCGCCGACA AGACGGCGGT GTCGCTGCGC CCGCACGACA GCAGGACCGG GTACCTGTCG 
CACGACAGCG GCAGGCTCGT CGTGGCCGAG CCGGGCAGCT CCGACGCGCG CAAGCGCGCG 
ACGTTCAAGG TCGGGTGA

Protein sequence

MSTLDRRSLL RAGGALAAAS TLPALGATTA SAQEPARTAA AQGVSAQAVP GQAAIDVTPA 
LPTRSPLVEQ RADPFVTPPT DGMYYLTGSV PEYDRIVIRG ASTLDGLTTA RERTIWRRPT 
SGKLGGYIWA PELHRIDGKW YVYFAAGDSD EPFRIRTYVL ESANADPRAD GWVLRGQVTT 
AWDTFTLDAT TFEHRGKRYF LWAQSEPGIA TNSNLYIAEM ASPLALKSAP VRIAVPTLSW 
EIQGFKVNEG AAVLIRNGRV FVTYSASATD SRYCMGLLTA DENANLLDAR SWTKSQTPIF 
TTNTETGQYG PGHNSFTTVD GADVMVYHAR DYRDITGDPL FDPNRHARVQ RVHWNDDGTP 
SFGVPVGKGG PISRLSPLDA PTLFVRHYDY KLRVDGNVRT VADSQFRFVP GFFGAGTVAL 
QSVNYPNRYA RVVDGVTIRV DPYEDSDAYG RAASFVRVEG LADKTAVSLR PHDSRTGYLS 
HDSGRLVVAE PGSSDARKRA TFKVG