Gene Amir_2166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_2166
Symbol
ID	8326355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	2389972
End bp	2391369
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	73%
IMG OID	644942716
Product	Cellulase
Protein accession	YP_003099957
Protein GI	256376297
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG5297] Cellobiohydrolase A (1,4-beta-cellobiosidase A)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGATCAA CGACCACGGC GCGCGGCAAC GGCGCCACGC CGTCGAAGTC CCGTCGCGGG 
AAGGTGGCAG CGGGAGCGCT GTCCAGCGCG CTGGTCGCCG CGGCCACCGC CATCGCCACG 
GGGACGGCTT CCCCCGCGGC GGTGGCGGCG GACTCGGAGT TCTACTCCGA CCCGGCGACC 
AGCGCGGCCA GGTGGGTGGC GGCGAACCCG AACGACAGCA GGGCCGCCGT CATCCGCGAC 
CGCGTCGCCT CGGTACCCCA GGCGAAGTGG TTCACCACGA CCAACACGTC CACGATCCGC 
GCCGAGGTGG ACGCCCACAC CTCGGCGGCG GCGTCGGCGG GCAAGACCCC GATCCTGGTG 
GTCTACAACA TCCCCAACCG CGACTGCGGC GGCGCGAGCG GCGGCGGCGC GCCCTCGCAC 
GGCGCCTACC GGCAGTGGGT CGACCAGTTC GCGGCGGGAC TCGCGGGCCG CCCGGCCGCG 
ATCATCCTCG AACCCGACGT CCTCCCGATC ATGAGCACCT GCCAGAGCGC GTCCCAGCAG 
GCCGAGACCC GCGCGTCGAT GGCCTACGCG GGCAAAGCGC TCAAGGCCGC GTCGAGCCAG 
GCGAAGGTGT ACTTCGACAT CGGCCACTCG GCCTGGCTGA CCCCGGCCGA GGCGGCGAAC 
CGCCTGCGCG CGGCGGAGGT CTCCACCAGC GCGGACGGCA TCGCGACCAA CGTCTCCAAC 
TACCGCCGCA CCGCCGACGA GGTGGCGTTC GCCAAGGCCA CCCTGAACGC GCTCGGCGAC 
GGCAGGCTCA AGGCCGTCGT CGACACCAGC CGCAACGGCA ACGGACCGCT CGGCAGCGAG 
TGGTGCGACC CGCCCGGCCG CGCGATCGGC ACGCCCAGCA CCAGGAACAC CGGCGACCCG 
CAGATCGACG CCTTCCTGTG GGTGAAGATC CCCGGCGAGG CGGACGGCTG CATCGCGGGC 
GCGGGCCAGT TCGTGCCGCA GCGCGCGTAC GACATGGCGG TGGCCGCAGG TCCCGCCCCG 
ACGACGACAA CGACGACCAC CACGACCACG CGCGTCACCA CGACCACCAC CACGCCCCCG 
CCGAACGGCG CGGCCTGCGT GGTGCGGCAC CGGGTGGTCA GCTCGTGGTC GGGCGGCCAC 
ACCGGCGAGG TGGTGATCGA GAACCGGGGT CCGGCGCTCC AGAACTGGAC CTTGGAGTTC 
TCCGCCCCCG GCGTGGCCGT CTCCCAGGGC TGGAACGGGA CGTGGACGGA CCTGGGCGAC 
ACCGTCCGGG TCACGAGCGC GTCCTGGAAC GGCGGGATCG CCACCGGTGG AACCGCGACC 
ACCGGCTACT CGGCGAGCTT CAGCGGCGGC ACGCCCCCGT TCACGTCTCC CGTGCTGAAC 
GGAACGGCCT GCGCCTGA

Protein sequence

MRSTTTARGN GATPSKSRRG KVAAGALSSA LVAAATAIAT GTASPAAVAA DSEFYSDPAT 
SAARWVAANP NDSRAAVIRD RVASVPQAKW FTTTNTSTIR AEVDAHTSAA ASAGKTPILV 
VYNIPNRDCG GASGGGAPSH GAYRQWVDQF AAGLAGRPAA IILEPDVLPI MSTCQSASQQ 
AETRASMAYA GKALKAASSQ AKVYFDIGHS AWLTPAEAAN RLRAAEVSTS ADGIATNVSN 
YRRTADEVAF AKATLNALGD GRLKAVVDTS RNGNGPLGSE WCDPPGRAIG TPSTRNTGDP 
QIDAFLWVKI PGEADGCIAG AGQFVPQRAY DMAVAAGPAP TTTTTTTTTT RVTTTTTTPP 
PNGAACVVRH RVVSSWSGGH TGEVVIENRG PALQNWTLEF SAPGVAVSQG WNGTWTDLGD 
TVRVTSASWN GGIATGGTAT TGYSASFSGG TPPFTSPVLN GTACA