Gene Amir_2574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_2574
Symbol
ID	8326763
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	2906250
End bp	2907599
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	67%
IMG OID	644943116
Product	extracellular solute-binding protein family 1
Protein accession	YP_003100357
Protein GI	256376697
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.316894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTACCA CCAGCCGCCG CGCGCGGGTG GCCGTGGCGA TGGCCGCCGC GCTCACCACC 
GCGCTCACCG CCTGCTCCTC CGGCGACACC GCCGCGAACC AGCCGGCGGG CATGACCGGC 
ACCGCTGACG CCGTCGACGC CGCCCTGAAG GCCGGTGGCG AGATCACCTA CTGGAGCTGG 
ACCCCTTCGG CGCAGGCGCA GGTCGACGCC TTCATGAAGG AGTACCCGCA GGTCAAGGTG 
AACTACGTCA ACGCGGGCAC CAACAAGGAC CAGTACACCA AGCTGCAGAA CGCGATCAAG 
GCCGGCTCGG GCGCGCCCGA CGTGGCCCAG GTCGAGTACC AGGCCCTGCC GCAGTTCGCG 
ATGACCGACT CGCTGCTGGA CCTCGGCCAG TTCGGGTTCA ACGAGTACGA GAAGGACTAC 
ACCGCCTCCA CCTGGAACTC GGTGAAGGTC GGCGGCGGCC TGTTCGGCCT GCCGCAGGAC 
TCGGGCCCCA TGGCGATGTT CTACAACAAG GAGGTGTTCG ACCAGTACCA GATCCAGGTC 
CCCAAGACCT GGGACGAGTA CGTCGCCGCC GCCGAGAAGC TGAACGCCGC GGACCCCACC 
AAGTTCATCA CCGCGGACTC CGGTGACGCC GGCTTCGCCA CCAGCATGAT CTGGCAGGCG 
GGCGGCAAGC CGTTCACCGT CGACGGCACC AACGTCAAGG TGAACCTGCA GGACGAGGGC 
GCCAAGAAGT GGACCGAGAC CTGGAACAAG CTGGTCTCCA AGAAGCTCAC CGCGCCCACC 
ATCACCGGCT GGTCGGACGA GTGGTACCGG GGCCTGGGCA ACGGCAGCAT CGTCACGATG 
ATCAACGGCG CCTGGATGCC CGGCATCCTC GAGGCCTCCG TGCCTGACGG CAAGGGCAAG 
TGGGCCGTGG CCCCGATGCC GACCTACGAC GGCAAGCCCG CGACCGCCGA GAACGGCGGC 
GGCGGCCAGT CCGTCATCAA GCAGAGCGCC AACCCCGCGC TCGCGGCGGG CTTCGTGCGC 
TGGCTGAACC ACGAGCAGGG CGGCATCGAC AAGTTCATCG AGTTCGGCGG CTTCCCGGCC 
ACCACCAAGG AGCTCGAGTC GGACGCGTTC CTGAACGCCG AGTCCGCGTA CTTCGGCGGC 
CAGAAGATCA ACCAGGTCCT CTCGCAGGCG GGCAAGGACG TCGTGAAGGG CTGGGAGTAC 
CTGCCGTTCC AGCTGTACGC CAACAGCATC TTCAACGACA ACGCCGGTAG CGCCTACGCC 
AACGCCAGCG ACCTGAACGC GGGTCTGGCC TCCTGGCAGA AGGCCATCAC CGAGTACGGC 
AACCAGCAGG GCTTCACCGT CACCAACTGA

Protein sequence

MSTTSRRARV AVAMAAALTT ALTACSSGDT AANQPAGMTG TADAVDAALK AGGEITYWSW 
TPSAQAQVDA FMKEYPQVKV NYVNAGTNKD QYTKLQNAIK AGSGAPDVAQ VEYQALPQFA 
MTDSLLDLGQ FGFNEYEKDY TASTWNSVKV GGGLFGLPQD SGPMAMFYNK EVFDQYQIQV 
PKTWDEYVAA AEKLNAADPT KFITADSGDA GFATSMIWQA GGKPFTVDGT NVKVNLQDEG 
AKKWTETWNK LVSKKLTAPT ITGWSDEWYR GLGNGSIVTM INGAWMPGIL EASVPDGKGK 
WAVAPMPTYD GKPATAENGG GGQSVIKQSA NPALAAGFVR WLNHEQGGID KFIEFGGFPA 
TTKELESDAF LNAESAYFGG QKINQVLSQA GKDVVKGWEY LPFQLYANSI FNDNAGSAYA 
NASDLNAGLA SWQKAITEYG NQQGFTVTN