Gene Amir_0761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_0761
Symbol
ID	8324924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	841988
End bp	843802
Gene Length	1815 bp
Protein Length	604 aa
Translation table	11
GC content	67%
IMG OID	644941304
Product	extracellular solute-binding protein family 5
Protein accession	YP_003098569
Protein GI	256374909
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.952848
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGAGAA AGACCGTCTC GGCGTTCGCG CTGATGACCA GTGCGGCGCT CTTGCTGAGC 
GCCTGTGGCG GCGGCGGCGC CGGCAGCGAG GGCGAAGGCG GCCAGCAGGA CTCGAACCCC 
GGTGCGATCG GGGGCCAGGA CGAGATCTTC AAGCGTCCGG CCGTCGACGA CATCGGCGAG 
GTCGCGATCG CCGTCGAAGA GGGCTTCACC AACTACAACA ACTTCACGGG TGCGACGAAC 
AACTTCGCCA GCACCATGGC GTTGTCGAAC GTGCAGCCCT CGCCGTACAT CGTCGACCTG 
GTCGACGGCA AGGTCGTCAT CAAGGTCGAC GGCGACCTGA TGGAGTCCAT CAAGGTCACC 
TCGAACGACC CGCAGGTCAT CGAGTGGAAG GTCCGCAAGG AGGCGGTCTG GTCCGACGGC 
CAGCCGATCG ACTGCAAGGA CTTCCACCTG AAGTGGCTGG CCGCGACCAG CCAGGCCAGG 
ACGACGACCT CCGACGGCGA GTCCGCCTCG ATCTTCGACG CGACCCCCAC CGGGTACGAG 
GACATCGAGA AGCTCGAGTG CGCGGACGGC AACAAGACGA TCACCACGAC GTTCAAGAAG 
CCGTACGCCG ACTACCGCGG CCTGTTCTCG CAGCCCGGTA GCGACGGCCT CCTCCCGGCC 
CACGTGCTGG AGCAGAAGAC CGGCATCGAG GACATCACCA AGATCACCCC GGCGCAGAAC 
GACGAGACGG TCAAGAAGGC CGCCGAGTTC TTCACCAAGG GCTGGAACGG CTGGAGCGCC 
GACGTCGCCC TCTCCGGTGG CCCGTACGTC ATCACCTCGG CCGACCTGAG CGACCAGACG 
GTCCTCGAGC GCAACCCGAA GTGGTGGGGC AACAAGGGCG GCCCGGCCAA GGTCATCCTG 
AAGACGAACC GCGACGCCCA GTCCGCGGCC CAGCAGCTGC AGAACAAGGA AGTCCAGGCG 
ATCGCGCCGC AGGCCGACAA CGCCGTGGCG CAGCAGCTCC GGGGCAGCGA CGCCTACACG 
GTCTTCGCCA GCGGTGGCCA GACCTACGAG CACATCGACC TGAACATGGC CAACCCGCTG 
TTCGGCCAGA ACAAGGAGCT CCGCGAGGCG TTCGCGATCT GCACCCCGCG GACCGAGATC 
GTCGAGAAGC TCGTCCAGGA CGTGCAGCCG GGCGCCAAGC CCCTGGGCAG CCTGACCTTC 
ATGCCCAACG AGGTCGGCTA CGAGGACCAC TACTCCGACC TGGCCGACGG TGACGCCGAG 
GCCGCCAAGA AGGTCATGGA GGCCGGTGGC TGGACCCTGG GTGGCGACAA CGTCTACACC 
AAGGGCGAGT TCCGCGCGTC CTTCAAGCTG AGCCACAAGA CCGTGACCCG TCGCGCGCAG 
ACCGTGCGCC TGGTCCAGGC CTCCTGCGCC AAGGCGGGCA TCGAGGTCAT CGCCGACGAG 
GCCGCCGACT TCAACGACAA GCGCCTCCCG GCCTCCGAGT TCGAGGCCGC CCTGTTCGCG 
TGGGTCGGCG CCCCGCTGAA GGCAGGCGCG TTCGGCAACT ACGCCCAGAA GGCCAAGGGC 
GGCTCGGCGA ACTACAACAA CTACGACTCG GCGACCGTCA CCGACACGTG GGCGAAGGCG 
AACAGCGAGC TCGACTACGA GAAGCGCATC ACGCTGATGA ACGACGTCGA CAAGGCGATG 
CGCGCCGACC TGGCGAGCAT CCCGCTGTTC CAGCACACCG ACTTCACCGC CTCCTCCTCG 
GAGTACGGCC CGGTGAGCTA CATCGGTGTC GCGGGTGGCA TCACCTGGAA CCTGTACGCC 
TGGCAGAAGA AGTAG

Protein sequence

MRRKTVSAFA LMTSAALLLS ACGGGGAGSE GEGGQQDSNP GAIGGQDEIF KRPAVDDIGE 
VAIAVEEGFT NYNNFTGATN NFASTMALSN VQPSPYIVDL VDGKVVIKVD GDLMESIKVT 
SNDPQVIEWK VRKEAVWSDG QPIDCKDFHL KWLAATSQAR TTTSDGESAS IFDATPTGYE 
DIEKLECADG NKTITTTFKK PYADYRGLFS QPGSDGLLPA HVLEQKTGIE DITKITPAQN 
DETVKKAAEF FTKGWNGWSA DVALSGGPYV ITSADLSDQT VLERNPKWWG NKGGPAKVIL 
KTNRDAQSAA QQLQNKEVQA IAPQADNAVA QQLRGSDAYT VFASGGQTYE HIDLNMANPL 
FGQNKELREA FAICTPRTEI VEKLVQDVQP GAKPLGSLTF MPNEVGYEDH YSDLADGDAE 
AAKKVMEAGG WTLGGDNVYT KGEFRASFKL SHKTVTRRAQ TVRLVQASCA KAGIEVIADE 
AADFNDKRLP ASEFEAALFA WVGAPLKAGA FGNYAQKAKG GSANYNNYDS ATVTDTWAKA 
NSELDYEKRI TLMNDVDKAM RADLASIPLF QHTDFTASSS EYGPVSYIGV AGGITWNLYA 
WQKK