Gene Amir_6238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_6238
Symbol
ID	8330449
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	7316946
End bp	7318604
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	70%
IMG OID	644946669
Product	cellulose-binding family II
Protein accession	YP_003103888
Protein GI	256380228
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG5297] Cellobiohydrolase A (1,4-beta-cellobiosidase A)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGACCA GAACGGGCGT GCTGCTCGCC GTCGCGGCTC TCGCCGCAGG TTCCTACGCG 
TTGATCCCGT CCGCGAGCGC GGCCACGAAC CTCACGGCCA CCTTCGCCAA GACCCAGGAC 
TGGGGCAGCG GCTTCGAGGC GAAGTTCACC GTCGCCAACG GCGGGTCGTC GGCCTCGAAC 
AACTGGAAGA TCGAGTTCGA CCTGCCCTCC GGCACCACGG TCGGCTCCTT CTGGGACGCG 
CAGGTCACCC GGAACGGCGA CCGCTACACG GCGACCAACC GGGACTGGAA CGCGGCGGTC 
GGCGCGGGCT CCTCGGTGGC GTTCGGGTTC ATCGGCGCGG GCGGCGGCGC CCCCACGAAC 
TGCACGATCA ACGGCGCCCC CTGCACCGGC ACCGGCACCG GCAACCCCGG CGACACGGCC 
GCGCCGAGCG TCCCCGGCGG CCTGAAGGCC ACCGCCACCA CGGCCGACTC GGTCACGCTG 
GCCTGGAACG CGTCGGCCGA CAACGTCGGC GTGGTCGCGT ACGACGTGTA CAAGGGCGGC 
GACAAGGCCA CCACCGTCGC GAGCCCCACC GCGATCGTGT CCGGCCTGAC CGCCGACACC 
TCGTACCAGT TCAGCGTCGT GGCGCGCGAC GCGGCGGGCA ACGCCTCGGC GAAGAGCCCG 
GCGCTGACCG CGAAGACCGC GAAGAAGGCG GGCACCACCC CGGAGCCCTC GCCCGAGCCG 
TCGCCGAACC CCAACCCCAC CCCGCAGCCG AGCCCGGACC CCACCCCGGA CCCGCAGCCG 
TCCCCGGCGG GCGGGCGCGG CGCCCCCTAC CTGTTCCTGG GCTGGGGCAA CCCGCAGTCC 
GCGACCGCGG TGATGCAGCA GACCGGCGTC AAGTGGTTCA CGATGGCGTT CATCCTGTCC 
TCGGGCGGCT GCACCCCCTC GTGGGACGGC ACCCGACCGC TGACCGGCAG CGTGGACGAG 
ACCACGATCA AGGCGATCCG CGCGGCGGGT GGTGACATCG TGCCGTCGTT CGGCGGCTGG 
AGCGGCAACA AGCTCGGCCC GAACTGCTCG ACCCCCGAGG CCCTGGCGGG CGCGTACCAG 
AAGGTCATCG ACGCCTACCA GCTCAAGGCG ATCGACATCG ACATCGAGAA CTCCGACGAG 
TTCGAGAACG AGGTCGTGCA GGACCGCGTG CTGTCCGCGC TGAAGATCGT CAAGCAGAAG 
AACCCGAACG TGCAGACCAT CGTCACGTTC GGCACCGGCA CCACCGGCCC GAACTTCTGG 
GGCAACCGCC TCATCGAGCG GGCGGGCGCG CTGGACGCCA AGATCGACGT CTTCACGATC 
ATGCCGTTCG ACTTCGGCAG CTCCAACATC GCGACCGACA CCATCAGCGC GGCCACCGGG 
CTGAAGAACA AGGTGAAGTC GACCTTCGGG TACAGCGACG CCGACGCCTA CAAGCACATC 
GGCATCTCGG GCATGAACGG CCTGTCCGAC CAGAAGGAGC TGACCACCGC CGCGGACTGG 
ACCAAGATCC GCGACTGGTC GAAGAACAAC GGCCTCGGCC GCCTCGCGTT CTGGGCGGTC 
AACCGGGACC GCGGCGGCTG CGACGGCCAG GTGTCGGCCA GCTGCTCAGG CATCTCGCAG 
GCCGACCTGG AGTTCACCCG CATCACCGCG GGCTTCTGA

Protein sequence

MKTRTGVLLA VAALAAGSYA LIPSASAATN LTATFAKTQD WGSGFEAKFT VANGGSSASN 
NWKIEFDLPS GTTVGSFWDA QVTRNGDRYT ATNRDWNAAV GAGSSVAFGF IGAGGGAPTN 
CTINGAPCTG TGTGNPGDTA APSVPGGLKA TATTADSVTL AWNASADNVG VVAYDVYKGG 
DKATTVASPT AIVSGLTADT SYQFSVVARD AAGNASAKSP ALTAKTAKKA GTTPEPSPEP 
SPNPNPTPQP SPDPTPDPQP SPAGGRGAPY LFLGWGNPQS ATAVMQQTGV KWFTMAFILS 
SGGCTPSWDG TRPLTGSVDE TTIKAIRAAG GDIVPSFGGW SGNKLGPNCS TPEALAGAYQ 
KVIDAYQLKA IDIDIENSDE FENEVVQDRV LSALKIVKQK NPNVQTIVTF GTGTTGPNFW 
GNRLIERAGA LDAKIDVFTI MPFDFGSSNI ATDTISAATG LKNKVKSTFG YSDADAYKHI 
GISGMNGLSD QKELTTAADW TKIRDWSKNN GLGRLAFWAV NRDRGGCDGQ VSASCSGISQ 
ADLEFTRITA GF