Gene Amir_4241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_4241
Symbol
ID	8328434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	4998389
End bp	4999657
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	76%
IMG OID	644944705
Product	extracellular solute-binding protein family 1
Protein accession	YP_003101942
Protein GI	256378282
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGCCG GGGGACTGGA CCGACGCTCG TTCCTCGCGG CAGCCGGGCT GCTCGGCCTC 
GGGCTGGGCG GGCCGTCGCT GGCCGCCTGC GGGTCCAACA CCGGGCGCGA CGGGTCCGCG 
CCGGGCACGC TCAGCCACTG GTACCACGCC TACGGCGAGG ACGGCGTGCA GGACGCCGTG 
CGCCGGTACG CCGCCGACTA CCCCGACGCC CGCGTCGAGG TGCAGTGGAA CCCCGGCGAC 
TACGAATCCA AGATCGCCAC CGCGCTCCAG GGCGGCCGGG TGCCCGACGT GTTCGAGGCC 
CAGGTCAAGG TCGACTGGGT CCGGCAGCAG CGGGTCGTCC CGCTCGACGA CCTCCTCGGC 
GACCAGCGCC CCGACTTCGT CAAGACCCTC CTGGACTCGC AGACCGTCGA CGGCAGGCTC 
TACGGCGTCC CCCAGGCCAT CGACACCCAG GTCCTGTTCT ACCGCCCCAG CCTCCTGCGC 
GAGGCGGGCG TCACCCCGCC CACCACCGTG GACGAGCTGG TCGACGCCAC CCGCCGCCTG 
TCCGGCAACA CCGCGCGCGG CTTGTTCGCG GGCAACGACG GCGGCGTCGC CGTGCTCACC 
GCGCCGCTGC TGTGGTCCGC CGGGCTCGAC CTGCTCAGCC CGGACGGCGA GTCCCCCGGC 
TTCGACGACC CGCGCGCCGC CACCGCCGTC GGCAAGCTCC GCGAGCTGCA CGCCACGGGC 
GGCCTCCTGC TCGGCGCCCC TGCCGACTGG GCCGACCCCG GCGCGTTCAC CGAGGGCCTG 
ACCGCCATGC AGTGGACCGG CCTGTGGAAC CTGCCCAAGA TCGTCGAGGC GCACGGCGAC 
GACGTCGGCG TCCTGCCCTT CCCGCGCCTG GACGCCGACG GCGCCGAGTC CGTGCCCGTG 
GGCGCCTACA GCGCGATGGT CAACGCCCGC GCCGCCGACG TCGAGCGCGC CAAGGACTAC 
GTGCGCTGGC TGTGGGTCGA GCGGACCGAC CACCAGGCCG AGTTCGCCAC CGCCTTCGGC 
GCGCACCTGC CCGCCCGCGC CAGCCTGCGC CCCGCCGCCG ACCGGCTCAG CGGCGGGCTC 
GGCGCGGACG TCGCCCAGCT CGTCGCCGAC GTCGGCCGCG TCGCCAGCCC GGCCCGCTGG 
AGCGCCGCCG CGAACACCGC CCTGTCCGAC GCCGTCTCCC GCGTCGCCCG CGAGGGCGCC 
GACCCCGCCG AGGAGCTGCG CGCCGCCGTC GCCACCGCCC GCGACGAGCT CACCAGGCTG 
GACCGGTGA

Protein sequence

MGAGGLDRRS FLAAAGLLGL GLGGPSLAAC GSNTGRDGSA PGTLSHWYHA YGEDGVQDAV 
RRYAADYPDA RVEVQWNPGD YESKIATALQ GGRVPDVFEA QVKVDWVRQQ RVVPLDDLLG 
DQRPDFVKTL LDSQTVDGRL YGVPQAIDTQ VLFYRPSLLR EAGVTPPTTV DELVDATRRL 
SGNTARGLFA GNDGGVAVLT APLLWSAGLD LLSPDGESPG FDDPRAATAV GKLRELHATG 
GLLLGAPADW ADPGAFTEGL TAMQWTGLWN LPKIVEAHGD DVGVLPFPRL DADGAESVPV 
GAYSAMVNAR AADVERAKDY VRWLWVERTD HQAEFATAFG AHLPARASLR PAADRLSGGL 
GADVAQLVAD VGRVASPARW SAAANTALSD AVSRVAREGA DPAEELRAAV ATARDELTRL 
DR