Gene Amir_2170 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_2170
Symbol
ID	8326359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	2399697
End bp	2401295
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	70%
IMG OID	644942720
Product	extracellular solute-binding protein family 1
Protein accession	YP_003099961
Protein GI	256376301
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.76717
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGCGG CTGCCGGTGG TGCGCTGCTC GTCGGCTGCG GTGGGCCCGC GCCGCAGCAG 
GGCGGCGGCG GTGGCGCGCT CAACTCGGAG GAGCTGGCCA AGCTGCTCCC GGCCTACTCG 
CCCGTCGAGT ACGCCAAGCC CGACCTGCCC GGCGTCAACG GGTCCAAGGC AGGCTACCTG 
AAGTTCCCCT CCACGCTCGT GGACGCGGTC AAGGAGAAGC CGCTCTCCGG CGGCGAGGTC 
ACCGTCATGA CCCCGACGTT CTGGCCGGTG CCGCCGGGCC TCGGGCAGAA CTCCTACTAC 
GACGCCGTGA ACGAGCGGCT CGGCGGCACG GTCAAGTTCG AGCTGGTGGC GGGCGCGGAC 
TACGCGCAGA AGCTCGCGGC CATGATGGCG GGCAAGCAGG TGCCCGAGCT GACCGTCATG 
CCCACCTTCA CCGTGCCGCC CCGGTTCAGC GCGGGCGTCG GCGAGGTGTT CCGCGACATC 
GGCGGCCTCA TCGCGGGCGA CAAGGCCAAG GACTACCCGA TGCTCGCGGG CATCCCCACC 
GCCGTGTGGG AGAACTGCGT CTACAACGGC AAGCTGTTCG CGGTGCCGTT CCCCGGCGAC 
CTGTTCGCCG AGGCCACCTT CTACCGGCCC GAGCTGTTCG AGAGCCTCGG CGTCGACCCG 
CGGGTCAAGT CCTTCGCGGA GCTGAAGGAC CTGTGCGCCA AGGTGAACGA CCCGGCGGGC 
AACCGCTGGG CGGTCGGCGA CATCTTCCGC ACGCTCGTGC GCGCTCGGGG CGACAAGGGC 
GACTGGCAGC GCGACTCCTC CGGCAAGGTC GTCAACCACA TCGAGACGCC CGAGTACGCC 
GCGGCCATCC GCGACATGCG CGAGCTGTTC GACGCCGGCT ACGTGCACCC CGACGTGGTC 
GCGGGCAACT TCAGCCGCCT CAAGGAGCTG TTCGCCTCCG GGCAGGTCCT GCTGCACCAG 
GACGGCGTCG GCGCGTGGCA CGAGACCTTC GAGCAGCAAC GGCCGGTGAA CCCGGACTTC 
CGGATGTCCG CCATCCTGCC GTTCGCCTCG GACGGCGGGA AGGCCACCTA CCCGATCAGC 
AACCCGGTCT CCATGCTCAC CCTGTTCCGC AAGGACCTCT CCGACGACCG GGTCAAGGAG 
CTGCTGCGGC TGTGCAACTT CGCCGCCGCG CCGTTCGGCA CCAGCGAGCA CTTCCTGCTG 
CGCTACGGCA TCGACGGCAA GCACAGCACC CGCAACGCCG ACGGCTCGCC GCAGCTGAAC 
GCCCTGGGAG CCAAGGAGAT CACCCTGACC TACGGGTTCA TCTCCGGCCC CGCCGAGGCG 
TACGCGCACA CCCAGTTCCC GGACTTCGTG CGCGAGGCCC ACGCCTGGCA CGCGGACGCC 
TACTCCAAGC AGGTCAAGCC GATCACGTTC GGCCTGCGCA TCGAGGAGCC GGCCGAGCTG 
ACCAAGCTGG GCAAGCAGTT CGAGGACCGC ACCAACGACA TCCTGCGCGG GCGCGCCAGC 
GCCAAGGACG CGGACGGCCT GGCCGAGGAG TGGCGCAAGG CGGGCGGCGA CAAGCTGCGC 
GAGTTCTACG ACAAGGTCCT CACCGATGCC GGGCGCTGA

Protein sequence

MSAAAGGALL VGCGGPAPQQ GGGGGALNSE ELAKLLPAYS PVEYAKPDLP GVNGSKAGYL 
KFPSTLVDAV KEKPLSGGEV TVMTPTFWPV PPGLGQNSYY DAVNERLGGT VKFELVAGAD 
YAQKLAAMMA GKQVPELTVM PTFTVPPRFS AGVGEVFRDI GGLIAGDKAK DYPMLAGIPT 
AVWENCVYNG KLFAVPFPGD LFAEATFYRP ELFESLGVDP RVKSFAELKD LCAKVNDPAG 
NRWAVGDIFR TLVRARGDKG DWQRDSSGKV VNHIETPEYA AAIRDMRELF DAGYVHPDVV 
AGNFSRLKEL FASGQVLLHQ DGVGAWHETF EQQRPVNPDF RMSAILPFAS DGGKATYPIS 
NPVSMLTLFR KDLSDDRVKE LLRLCNFAAA PFGTSEHFLL RYGIDGKHST RNADGSPQLN 
ALGAKEITLT YGFISGPAEA YAHTQFPDFV REAHAWHADA YSKQVKPITF GLRIEEPAEL 
TKLGKQFEDR TNDILRGRAS AKDADGLAEE WRKAGGDKLR EFYDKVLTDA GR