Gene Amir_5309 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_5309
Symbol
ID	8329511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	6310806
End bp	6312149
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	68%
IMG OID	644945748
Product	extracellular solute-binding protein family 1
Protein accession	YP_003102976
Protein GI	256379316
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.574903
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTCAC TCCGATACGG CGGACTCGCC GCAGCCGTGC TCATGGCCAC CGCTGCCTGT 
GCAGGCGCGG GCGGCGGCGG TGGCGGGAAC GAGAACTCGA TCAACGTTCT CATGGTCAAC 
AACCCGCAGA TGGAAGACCT CCAGAAGCTC ACCGCGGACA ACTTCACCAA GGACACGGGC 
ATCACGGTGA ACTTCACCGT CCTGCCCGAG AACGACGTCC GCGACAAGAT CAGCCAGGAC 
TTCTCCAGCC AGGCCGGGCA GTACGACGTC GCCACGATCT CCAACTACGA GACGCCGATC 
TACGCCAAGA ACAACTGGCT GACCCCGCTC GACGAGTACG TCGCCAAGGA CTCCGGCTTC 
GCCCAGGACG ACGTCCTGGA GTCGGTGCGC CAGTCCCTGA CCGCCGCCGA CGGCAAGGTC 
TACGCCCAGC CGTTCTACGG CGAGTCCTCG TTCCTGATGT ACCGCAAGGA CATCATGGAC 
GCCAAGGGCA TCACCATGCC GGAGAAGCCC ACCTGGCAGC AGGTCGCCGA CATCGCCGCC 
CAGGTCGACG GCGCCGAGCC CGGCATGAAG GGCATCTGCC TGCGCGGCCA GCCCGGCTGG 
GGCCAGCTGA TGGCGCCGCT CACCACGGTC GTCAACACCT TCGGCGGCAC CTGGTTCACG 
AAGGACTGGC AGGCCCAGGT GAACTCCCCG GAGTTCAAGG AGGCCACCGA CTTCTACGTC 
AACCTGGTCC GCGACCACGG TGAGAACGGC GCCCCGCAGG CCGGCTTCGC CGAGTGCCTG 
AACAACATGA CCCAGGGCAA GGTCGCCATG TGGTACGACG CGACCTCCGC CGCCGGCCTC 
CTCGAGGGCG CCGACTCGCC GGTGAAGGGC AAGCTCGGCT TCGCCCAGGC CCCCGTGGTC 
AAGACCGACA GCTCGGGCTG GCTCTACACC TGGGCGTTCG GCATCCAGAA GGCCAGCAAG 
AAGGCCGACA ACGCCTGGAA GTTCATCTCC TGGGCCTCCG GCAAGGGCTA CGAGGAGCTG 
GCGGGCAAGT CCCTCGGCTG GTCGCGCGTC CCGGACGGCA AGCGCTCCTC CACCTACGCG 
CGCCCCGAGT ACCTCGAGGC CAGCGGCACG TTCGCCAAGC AGGTCGAGGC CGCCATCTCC 
GGCACCAAGC CGACCGACCC CGGCGTGCAG CCCCGCCCGG CCCCCGGCAT CCAGTTCGTC 
GGCATCCCGG AGTTCACCGA CCTGGGCACC CAGGTCTCCC AGAAGATCAG CGCCGCGATC 
GCCGGCTCCA CCACCGTCGA GCAGGCCCTG ACCGAGAGCC AGGCCCTGGC CGAGACCGTG 
GCCGAGAAGA ACCGGGGCAA GTGA

Protein sequence

MKSLRYGGLA AAVLMATAAC AGAGGGGGGN ENSINVLMVN NPQMEDLQKL TADNFTKDTG 
ITVNFTVLPE NDVRDKISQD FSSQAGQYDV ATISNYETPI YAKNNWLTPL DEYVAKDSGF 
AQDDVLESVR QSLTAADGKV YAQPFYGESS FLMYRKDIMD AKGITMPEKP TWQQVADIAA 
QVDGAEPGMK GICLRGQPGW GQLMAPLTTV VNTFGGTWFT KDWQAQVNSP EFKEATDFYV 
NLVRDHGENG APQAGFAECL NNMTQGKVAM WYDATSAAGL LEGADSPVKG KLGFAQAPVV 
KTDSSGWLYT WAFGIQKASK KADNAWKFIS WASGKGYEEL AGKSLGWSRV PDGKRSSTYA 
RPEYLEASGT FAKQVEAAIS GTKPTDPGVQ PRPAPGIQFV GIPEFTDLGT QVSQKISAAI 
AGSTTVEQAL TESQALAETV AEKNRGK