Gene Amir_4609 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_4609
Symbol
ID	8328807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	5490270
End bp	5491553
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	71%
IMG OID	644945056
Product	extracellular solute-binding protein family 1
Protein accession	YP_003102288
Protein GI	256378628
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTCCCACT CCATCAGCAG GCGCACCCTG CTGCGCGCCG CGATCGGTGG CGGTGTCGCC 
GCGCCGTTCC TGGCGGGGTG CGGCGCGTTG ACGCCCGCGT CCGGCAAACC CGGCGCCCTC 
TCGGTGCACA CCCAGCTCAG CGGCGCCGTC GCGGGCGCCA AGGTGTTCGC CGACGCGGTC 
GCCGCCTACG AGCGGCGGAC CGGTCGTCCG GTCGCGCTGC TCAAGAACGG CTCCGACCTG 
CCCATCGTCT TCGAGACCAG CTCGCTCGCC GGTGCGGAGG CCGACGTCGC CCTGGTGAAC 
CTGCAGGGCC GCACGCTCTC CTGGACCGGC CTGGGGGCGA CGATCCCGCT CACCGGGCTG 
CTCGACGAGT GGGGGCTGCG CGACAAGATC ATCCCCGAGG CGCTGGCCGA GTGGACCGAC 
GGGGACGGCA ACCTGCGCGC GTTCCCGTTC ACCCGCACCA ACTGGCCCGT CTCGTACAAC 
ACCAGGCTGC TGGAGCAGGC GGGCGTCCAG ATCCCGACGA CCTCCGACGA GCTGATCGCC 
GTGGCGCAGG CGTTGCGCGC CAAGGGGATC GGGCCGGTGA CGGTCGGCGG GTCCGACTGG 
AGCGGGCAGA AGATGTTCCT CCAGGTCATC CAGGGCTTCC TCACCCCCGA CGAGGCGAAG 
GAGGTGTTCG GCAGCGGCAA GCTCTCCGAG AGCCCCGCCG CCATCGCCGG GGTGGAGCAC 
TTCGTGGAGC TGCGGGACGC GGGCGTCTTC GTCGACGACG TGCAGGGCTA CACCTCCGAC 
TCGGAGCTGA CCCAGTTCAA CACCGGCAAG GCGGCGATCG TGCCCGCCAT GTCGTCGGCG 
CTGGCGAAGG TGCCCGCCGA GCGGGCGAAG GAGGTCGTCG TCGGCGGCTG GCCCAAGCCC 
TCGCGCGGCG GCGTGCTGGA GCACCCGAGC GTGATCCGCA GCTTCAACGG CCACGGCATC 
TGGATCAGCC GCAGGGGCGC GGAGAAGCTC GACCTGATCA AGCCGTTCGT GCAGGACCTG 
TACAGCGACG AGGTGATCGA CTCGATGATC CTGGGCTCCG GCCGGGACAT GAGCCGGATC 
ACGGACACGG TCAGCGAGGA CTTCCCGCTC GTCGCGCAGG CCTCCCGCCT CACCGACCAG 
CAGGTCTCCC CCGTCATGCT GCCCGACCTG GTCATCCCCC AGTCAGCGTT CGAGCCGATG 
ATCCAGGCCA CGGCAGCCGC CTACGGCCCG ATCCCCGCCG AACGGATCAT CGAGGTCTTC 
GAACGGGCCT ACGCCACGGT GTGA

Protein sequence

MSHSISRRTL LRAAIGGGVA APFLAGCGAL TPASGKPGAL SVHTQLSGAV AGAKVFADAV 
AAYERRTGRP VALLKNGSDL PIVFETSSLA GAEADVALVN LQGRTLSWTG LGATIPLTGL 
LDEWGLRDKI IPEALAEWTD GDGNLRAFPF TRTNWPVSYN TRLLEQAGVQ IPTTSDELIA 
VAQALRAKGI GPVTVGGSDW SGQKMFLQVI QGFLTPDEAK EVFGSGKLSE SPAAIAGVEH 
FVELRDAGVF VDDVQGYTSD SELTQFNTGK AAIVPAMSSA LAKVPAERAK EVVVGGWPKP 
SRGGVLEHPS VIRSFNGHGI WISRRGAEKL DLIKPFVQDL YSDEVIDSMI LGSGRDMSRI 
TDTVSEDFPL VAQASRLTDQ QVSPVMLPDL VIPQSAFEPM IQATAAAYGP IPAERIIEVF 
ERAYATV