Gene Amir_1846 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_1846
Symbol
ID	8326031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	2031447
End bp	2032724
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	68%
IMG OID	644942395
Product	extracellular solute-binding protein family 1
Protein accession	YP_003099640
Protein GI	256375980
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.169612
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGAGAG CACTTCTGGT CGCAGCAGCC GCCGCGCTCG CGCTGGCGGG GTGTTCCAGC 
GGCCCAGCGG ACGGCAAGGT GACGATCACC TTCTGGGACA ACAACGGCGG ACCCGGCCGC 
ACCCCGATCT ACGAGGAGCT CATCAAGCGC TTCGAGGCGG CCAACCCCGA CATCCACGTC 
GACTACGTCG GCATCCCCAG CTCGTCCGTG CAGCAGAAGT ACGACACCGC GATCGCGGGC 
GGCGGCACGC CCGACGTCGG CGGCGTCACC ACCTCGTACC TGTCCAACAT GGTCGGGCAG 
GAAGCGCTCG TGCCGCTGGA CGAGAAGGTC GACGGCGGCC CGCTCAAGGG CAAGCTGCTG 
CCCAGCCTGG TCGAGACGGT CCGGCAGACC GCGCCCGACA ACAAGCTGTA CTCCGTCCCG 
TCCTCCGGCA ACATGGACGT GATCTGGTAC CGGACCGACT GGTTCGCCGA GAAGGGCGTG 
CAGCCGCCGA GGACCTGGGA CGAGTTCACC GCCGCCGCCG AGAAGCTCAC CGACGCCTCC 
GCGAACCGGT ACGGCTACAC CATCCGGGGC GGCGCGGGCT CGGTGTTCCA GCTGCTCACC 
GAGGCGTACG CCTACTCGGG CACCGACTCG TTCTTCGAGG GCGGCAAGTC CACGGTGGAC 
GCCCCCGGCA ACGCCGACCT GGTGGAGAAG GTCGCGGCCC TGTACAAGAA GGCCACGCCC 
GAGGCGGACG TCAACAACAA CTACACCCAG ATGGTCGCCC AGTTCACCGG CGGCTCGGCG 
GCGATGATGC ACCACAACCT CGGTTCCTAC GGCGACGTCA CCAAGGCGCT GGGGGACAAG 
GTGCAGGCGC TCCCGCTGCC GGTCGGCCCG AGCGGCAAGC GCACCGTCGT GCCCAACCCC 
ACCGACGGCT TCGCGGTGTT CCGCAACAGC GAGAACCAGG ACGCCGCCTG GAAGTTCGTC 
GAGTTCCTGA CCTCGGCCGA GAGCAACAGC TACTGGAACG AGAAGGTCGG CCAGATCCCG 
GCCAACACCG ACGTGCGCTC GCAGCCGTGG ATCGAGCAGA ACAAGCCGGT GAAGATGGCG 
CTGGACGTGC TGGAGGACCC GGCCACGATC ACCGTGCCCG CCCCGGTCTA CCTGCCGCAG 
TACTCGTCCA TCACCAAGGC CGACAGCGAG CCCCAGTACC AGAAGGTGCT GCTCGGCCAG 
CTCGGCGCCG ACGAGTTCCT CAAGGCCATG GCCGAGAAGC TGACCACCGC GCAGCAGGAG 
TGGGAGGACC GGAAGTGA

Protein sequence

MRRALLVAAA AALALAGCSS GPADGKVTIT FWDNNGGPGR TPIYEELIKR FEAANPDIHV 
DYVGIPSSSV QQKYDTAIAG GGTPDVGGVT TSYLSNMVGQ EALVPLDEKV DGGPLKGKLL 
PSLVETVRQT APDNKLYSVP SSGNMDVIWY RTDWFAEKGV QPPRTWDEFT AAAEKLTDAS 
ANRYGYTIRG GAGSVFQLLT EAYAYSGTDS FFEGGKSTVD APGNADLVEK VAALYKKATP 
EADVNNNYTQ MVAQFTGGSA AMMHHNLGSY GDVTKALGDK VQALPLPVGP SGKRTVVPNP 
TDGFAVFRNS ENQDAAWKFV EFLTSAESNS YWNEKVGQIP ANTDVRSQPW IEQNKPVKMA 
LDVLEDPATI TVPAPVYLPQ YSSITKADSE PQYQKVLLGQ LGADEFLKAM AEKLTTAQQE 
WEDRK