Gene Amir_2781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_2781
Symbol
ID	8326970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	3207073
End bp	3209118
Gene Length	2046 bp
Protein Length	681 aa
Translation table	11
GC content	69%
IMG OID	644943319
Product	glycoside hydrolase family 5
Protein accession	YP_003100560
Protein GI	256376900
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2730] Endoglucanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.183868
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTCACCG CCGTCGCCAC CCTCGTCGGC GCGAGCTTCT CCGCCCCGCG CCCCGCCTCC 
GCCGAGGCCA CCGCCGACGC CGCGGGCTGC AAGGTCGACT ACACCGTCAC CAGCCAGTGG 
CAGAACGGCT TCTCCGGCGA CGTGCGCATC ACCAACCTCG GCGACGCGAT CAACGGCTGG 
ACCCTGACCT GGGCCTTCCC GAACGGCCAG GCCGTCTCCC AGGCGTGGAA CGCGAACGTC 
ACCTCCTCGG GCGCGACCGC CACCGCCACC AACGTCTCCT ACAACGCCGC GATCCCCACG 
AACGGCTCCG TCCAGTTCGG GTTCAACGGC TCCTGGAGCG GCACGAACGG CGTCCCGACC 
TCCTTCACCC TCAACGGGAC CGCGTGCACC GGCGGCGTCG CGCCGACCAC CACGACCACG 
CCCGTCACCA CGACCACCCC GAACCAGCCG CCCGGTGACG CCATGGCCAC CGTCGCGGCC 
ATGCAGCCCG GCTGGAACCT CGGCAACTCG CTCGACGCCA CCGGCTCCGA CGAGACCTCC 
TGGGGCAACC CGCGCATCAC CGAGGCGCTG CTGGACAACG TGCGCTCGCA GGGCTTCAAC 
AGCATCCGCA TCCCCGTCAC CTGGGGCCAG CACCAGGGCT CCGGCCCGAG CTACACCATC 
GATCCCGCGT ACCTGAGCCG AGTCAAGGAG GTCGTCGGCT GGGCCCTCGC CGACGGCTTC 
TACGTGCTGC TCAACGTCCA CCACGACTCG TGGCAGTGGA TCAACACCAT GCCGAGCGAC 
CGCGCCAACG TGCTCGCCCG CTACAACGCC ACGTGGACCC AGCTGGCCTC GGCGTTCAAG 
GACTCCTCGT CGAAGCTGCT GCTGGAGAGC GTCAACGAGC CGCAGTTCAC CGGCAGCTCC 
GGCGACGCCC AGAACGCGCA GCTGCTGGGC GAGCTCAACA CCTCGTTCCA CCGCATCGTC 
CGCGCCTCCG GCGGTGGCAA CGCCACCCGC CTCCTGGTCC TGCCCACCCT GCACACCTCG 
GCCGACCAGG CGCGCATCGA CGAGCTGAAC ACCACGCTCA CCGCGCTGAA CGACCGCAAC 
ATCGCCGCGA CCGTCCACTA CTACGGCTAC TGGCCGTTCA GCGTGAACGT CGCGGGCGGC 
ACCAGGTTCG ACGCCACCGC GCAGAAGGAC CTGACCGACT ACCTCGACCG CGCCCACGAC 
TCGTTCGTCG CGCGCGGAAT CCCGGTGATC CTCGGCGAGT ACGGCCTGCT CGGCTTCGAC 
CGGCACACCG GCACGATCGA GCAGGGCGAG AAGCTGAAGT TCTTCGAGCT CTTCGGCTAC 
TACGCCAAGC AGCGCAAGAT CACCACCATG CTGTGGGACA ACGGCCAGCA CCTCGGCCGC 
ACCTCGTTCC AGTGGAGCGA CCCGGAGCTG ATCGCCCAGA TCAAGTCGAG CTGGACCACC 
CGCTCCGGCA CCGCCTCCAC CGACCAGGTG TTCAGCGCCA AGTCCTCCGC GATCACCGCG 
AAGACGATCA CGCTGAACCT GAACGGGACG ACGTTCTCGG GACTGCGCAA CGGTTCCGCG 
GACCTGGTGC GCGGCACCGA CTACACCGTC TCCGGCGACC AGCTCACCCT GTCCGCCGCG 
CTGATCACCC GGCTGTCCGG CGCGCGCGCC TACGGCGTCA ACGCCACCCT GTCCGCCCGG 
TTCTCCGCGG GCGTGCCGTG GCGGATCGAC CTGATCACCT ACGACACCCC CGTGCTGCAG 
AACGCCACCG GCACCACGAG CGCCTTCTCG ATCCCCACGA ACTTCCGGGG CGACCGGCTG 
GCCACGATGG AGGCCAAGTA CGCGGACGGC TCCAACGCCG GACCGCAGAA CTGGACCTCC 
TTCAAGGAGT ACGACCACAC CTTCGCCCCG GACTACGCGG CCGGCGCCAC GCTGCTCAAG 
CCGGAGTTCT TCGCCGAGGT CAACGCGGGC CAGCGGGTCA CCCTGACGTT CCACTACTGG 
AGCGGGACCA CGCTGACCTA CCACATCACC AAGAACGGCA CGTCGGTCAC CGGCACCACG 
TCCTGA

Protein sequence

MLTAVATLVG ASFSAPRPAS AEATADAAGC KVDYTVTSQW QNGFSGDVRI TNLGDAINGW 
TLTWAFPNGQ AVSQAWNANV TSSGATATAT NVSYNAAIPT NGSVQFGFNG SWSGTNGVPT 
SFTLNGTACT GGVAPTTTTT PVTTTTPNQP PGDAMATVAA MQPGWNLGNS LDATGSDETS 
WGNPRITEAL LDNVRSQGFN SIRIPVTWGQ HQGSGPSYTI DPAYLSRVKE VVGWALADGF 
YVLLNVHHDS WQWINTMPSD RANVLARYNA TWTQLASAFK DSSSKLLLES VNEPQFTGSS 
GDAQNAQLLG ELNTSFHRIV RASGGGNATR LLVLPTLHTS ADQARIDELN TTLTALNDRN 
IAATVHYYGY WPFSVNVAGG TRFDATAQKD LTDYLDRAHD SFVARGIPVI LGEYGLLGFD 
RHTGTIEQGE KLKFFELFGY YAKQRKITTM LWDNGQHLGR TSFQWSDPEL IAQIKSSWTT 
RSGTASTDQV FSAKSSAITA KTITLNLNGT TFSGLRNGSA DLVRGTDYTV SGDQLTLSAA 
LITRLSGARA YGVNATLSAR FSAGVPWRID LITYDTPVLQ NATGTTSAFS IPTNFRGDRL 
ATMEAKYADG SNAGPQNWTS FKEYDHTFAP DYAAGATLLK PEFFAEVNAG QRVTLTFHYW 
SGTTLTYHIT KNGTSVTGTT S