Gene Amir_2534 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_2534
Symbol
ID	8326723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	2855727
End bp	2856941
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	75%
IMG OID	644943076
Product	extracellular solute-binding protein family 1
Protein accession	YP_003100317
Protein GI	256376657
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.478006
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCCTT CCACCCGCCA CGCCGTCCTG CGCGCGCTGG TCCCGCTCCT GCTCCTGACC 
TGCCTCCCCG GCTGCGCCCC GCCCGCCGAC CGCACCCTCG TGCGCGTCCT CGGCCCGTGG 
ACCGGAGCCG AGGAGGACCG GTTCCGCGCC GTGCTCGACC GGACCGGAGT GCCCTACGAC 
TACACCGGCA GCCGCGCCCT CGGCCAGCTG CTGCGCTCCA GGGTGCAGCA GGGCGACCCG 
CCCGACGTCG CCGTCCTGCC CGGCCTCGGC GAGCTGGCCG ACTACGCGCG GGGCGGCTAC 
CTGCGCGAAC TGCCCTCGCT GCCCGAGGCC GACTACGCGC CCCTCTGGCG GGACGTGGCG 
CGCGTGGGCG CCGAGGGCAC GCACGCCGTC GTCGTCAAGG CCGACCTCAA GAGCCTCATC 
TGGTTCGACC CCGGCTCGGA CGTGCGCCCG CCCGCGAACG CCGAGCAGCT CCTGGCGGAC 
GGCGCGCCGT GGTGCCTGGG TCTCGGCTCG TCGCCGGACG CGGGCTGGCC GGGCACCGAC 
TGGGTCGAGG ACCTGCTGCT GCACCGGTCC GGCCCCGAGG TCTACCGGCG GTGGGCCTCC 
GGGGAGCTCG CCTGGAGCTC ACCGGAGGTG CGCGGGGCCT GGCAGACCTG GGGCGCGCTG 
GTGTCCGGCG TCCCCGCCGA GCGGGCGCTG CTCACCGACT TCGACGACGC GGGCCTGGCC 
ATGTTCACCC GGCCCCAGGG CTGCGGGCTC GACCACCTCG GCTCGTTCGC GGGCGCCGTC 
TACCGGGAGC GCGGGCACCG CGGCGACTTC GCCCCCTTCC CCGACCTGGG CGCGAGCGGC 
TGGGAGGTGT CCGCCGACCT GGCCGGGCTC TTCACCGACT CGCCCGCCGC GCGCAGGCTC 
CTGACGCACC TGGCGGACGC CGAGGGCCAG CGGGTCTGGC CCGCTGCGGG CGGTGCATAC 
TCCGCCCACA AACGGGTACC CCCCTCCGGC TACGCCGATC CGGTGGACCG GCGGATCGCC 
GAAGTCCTCA CCGAGGGCGC GTCCCTGTGC CTCGACGCCT CGGACCTCAT GCCCCCGAGC 
CTGCGCTCCG CCTTCTACCG GGGCGTAATC AACTACCTCG AAGCCCCGGA GTCCCTCGAC 
GGGGTGCTGG ACGGTCTCGA CCACATCGCC GATTCGGTCG ACCGAACGGA GTGGATTACG 
CTACCTTGCG GCTGA

Protein sequence

MSPSTRHAVL RALVPLLLLT CLPGCAPPAD RTLVRVLGPW TGAEEDRFRA VLDRTGVPYD 
YTGSRALGQL LRSRVQQGDP PDVAVLPGLG ELADYARGGY LRELPSLPEA DYAPLWRDVA 
RVGAEGTHAV VVKADLKSLI WFDPGSDVRP PANAEQLLAD GAPWCLGLGS SPDAGWPGTD 
WVEDLLLHRS GPEVYRRWAS GELAWSSPEV RGAWQTWGAL VSGVPAERAL LTDFDDAGLA 
MFTRPQGCGL DHLGSFAGAV YRERGHRGDF APFPDLGASG WEVSADLAGL FTDSPAARRL 
LTHLADAEGQ RVWPAAGGAY SAHKRVPPSG YADPVDRRIA EVLTEGASLC LDASDLMPPS 
LRSAFYRGVI NYLEAPESLD GVLDGLDHIA DSVDRTEWIT LPCG