Gene Amir_0807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_0807
Symbol
ID	8324970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	885780
End bp	887042
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	70%
IMG OID	644941349
Product	extracellular solute-binding protein family 1
Protein accession	YP_003098614
Protein GI	256374954
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGATGA GGGGCGCGAC ACCGCGTCGT CGGCTTGCCG CCGCGGGGGG AGTCGCCGCG 
CTGGCGGCCT CCGTGCTGGC GGGTTGCGGT TCGGACGGCG GAGGGCTCGT CGTCAACGTG 
TACAAGTACC CGCAGGAGAG CTTCCAGCAG ATCGTCGACC GCTGCAACGC GGAAGCCGAC 
GGGTACGAGA TCGTCTACCA CAAGCTGCCC CGCGAGGCCG ACGGCCAGCG CGAGCAGCTG 
GTGCGCAGGC TCGCCGCGGG CGACACCGGC ATGGACGTGC TCGGCCTGGA CGTCACCTGG 
ACCGCCGAGC TCGCCGAGGC GGGCTGGATC AGGGAGTTCA CCGGGCAGGC CAAGAGCGCC 
GTCGAGGACG GCACGCTGGA GACGCCGCTG GAGACCGCCC GCTACCAGGG CAAGCTCTAC 
GCCGCGCCGG ACAACACGAA CGTCCAGCTG CTCTGGTACC GGGACGACCT CGTGCCGACC 
CCGCCCACCA CGTGGGCCGA GATGATGGAG ATGGGCGCCA AGCTCAAGGC CGAGGGCAAG 
CCCGGTCTCG TGCAGGCCAC CGGCAAGCAG TACGAGGGCC TCGTCGTCCT CTACAACACG 
CTGGTCAACT CCGCGGGCGG CGCGATCGTC GACGAGTCCG GCACCAAGGC CGTCGTGGAC 
GACAACGCGG TGAAGGCGCT GGAGGTCCTC AAGGAGTTCG CCACCTCCGA GGTGGTCGAC 
CCGTCGTTCT CCAACGCGGC CGAGGACCAG GCGCGCCTGG CCATGGAGGA GGGCAAGGCG 
GCCTTCCAGC TGAACTGGCC GTTCGTCTAC GCCGCCGCGC AGAAGCGCCC GGAGCTGGCC 
CCGCACTTCA AGTGGGCCCC GTACCCGGCG ATCGACGAGG GCACCCCGTC CAAGGTGACC 
GTCGGCGGCA TCAACTACGC CGTCAGCTCC TACAGCGAGC ACCCGGACGA GTCGTTCGAC 
GCGATCAGCT GCCTGCGCAA CGCGGAGAAC CAGAAGTTCG CCGCCATCAA CGACGGCGTC 
CCGCCGACCA TCGAGTCGAT CTACTCCGAC CCGGAGATGG CGGAGCCGTA CCCGATGAAG 
GAAGCCATCC TGGAGACGCT CAAGACCGCG AGCATCCGGC CGAGCACCCC GGCGTACCAG 
AACGTCTCCA CGGTCATCTC CACGATCCTG TCGCCGCCCG CGGGCATCGA CCCGAAGGCC 
ACCGCCGAGC GGCTGAAGTC CGAGCTGCAG GACGCGCTCG ACTCGAAGGG GGTCCTGCCG 
TGA

Protein sequence

MGMRGATPRR RLAAAGGVAA LAASVLAGCG SDGGGLVVNV YKYPQESFQQ IVDRCNAEAD 
GYEIVYHKLP READGQREQL VRRLAAGDTG MDVLGLDVTW TAELAEAGWI REFTGQAKSA 
VEDGTLETPL ETARYQGKLY AAPDNTNVQL LWYRDDLVPT PPTTWAEMME MGAKLKAEGK 
PGLVQATGKQ YEGLVVLYNT LVNSAGGAIV DESGTKAVVD DNAVKALEVL KEFATSEVVD 
PSFSNAAEDQ ARLAMEEGKA AFQLNWPFVY AAAQKRPELA PHFKWAPYPA IDEGTPSKVT 
VGGINYAVSS YSEHPDESFD AISCLRNAEN QKFAAINDGV PPTIESIYSD PEMAEPYPMK 
EAILETLKTA SIRPSTPAYQ NVSTVISTIL SPPAGIDPKA TAERLKSELQ DALDSKGVLP