Gene Amir_1678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_1678
Symbol
ID	8325863
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	1833856
End bp	1835517
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	67%
IMG OID	644942228
Product	extracellular solute-binding protein family 5
Protein accession	YP_003099473
Protein GI	256375813
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.495361
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGACTCA GGCGAACGGC CGCCCTCGCC CTCGCGGCGA TCACGGCCTT CACCCCGCTC 
GCCGCCTGCT CCACGAGCAA CCAGGGCGCG CAGTCCCAGG CCGGTGTGCT GAACGTGGGC 
AAGCCGGACG GCCCGCAGAC CGAGAACCAC AACCCGTTCC TCAACTCGTC CGCCGCGACG 
ATCATGGGCT ACCGCAGGCT GATCTTCGAG CCGCTGACCA TGGTCAACGA GACCGACGCG 
ACCCAGGAGC CCACGCCCTG GCTGGCCAGC GAGTGGGACT GGCAGGAGAA CTACTCCAAG 
CTCGTGCTGA CCGTGCGCGA GAACGTCACC TGGTCCGACG GCAAGCCGCT CACCCCGGCC 
GACGTCGCGT ACACGTTCAC CTTGCTGAAG AACAACCCCG GCCTGAACAT CCAGGGCCTG 
CCGATCGACG GCGCGAGCGT CGACGGCGGC AAGGTGACGG TGAGCTTCCC GCGCTCCCAG 
TTCACCAACC GCAACAAGCT CCTGGAGCAG TTCGTCGTCC CCGAGCACAT CTGGTCGACC 
TACGCGAACC CGTCAACGGA GACGGTCAAG AACCCGGTCG GCAGCGGCCC GTACACGCTG 
AAGTCCTTCA CCCCGCAGAC CCAGACCCTC GTCGCGCGCG ACAGCTACTG GCAGGAGCTG 
CCGCAGGTCA AGGAGGTCCG GTACACCGCG TACGCCGACA ACAACGCGCA GACCACCGCG 
CTGGCCAACG GCACCACCGA CTGGAGCTTC GTGTTCATCC CGAACTACGA GGCCGTCTAC 
ACCAGCAAGG ACCCGCAGCA CAACAAGCTC TGGTTCCCGC CGGTGCTGGG CATCCACGGC 
CTGTGGTTCA ACACCAAGAG CGCCCCGTGG GACAACCCGG CGCTGCGCCG CGCGGTGAAC 
CAGGTGGTCA ACCGGCAGGA CATCTTCGTG CAGGGCGAGG GCGGCTACTT CTACCCGAAG 
GTCGACAACA TCACCGGCAT CCCCACGCCC GCCGGTGACC CGTTCATCGC CGACGAGTTC 
AAGGGCAGGA CCGTCGAGGT GGACGTCGCC GCGGCCAAGA AGGAGCTGAC CGACAACGGC 
TTCAGCTACG ACGGCGACAA GCTCAAGGAC CCGTCCGGCA AGCCCGTGAC GCTGAAGATG 
ACCGTGCCGT CCGGCTGGTC CGACTACGTC ACCAACGTCG AGATCATCAA GGACAACGTC 
TCCGACATCG GCGTCGAGGC CACCGTCGAG CTGCAGAACG TCGACGCCTG GACCAAGGCG 
CTGGACACCG GCGACTTCCA GGCCGCGCTG CACTGGACCA ACAACGGTCC CACGCCGTAC 
GACATCTACC AGTCCATCAT GGACGGCGCG CTCTACAAGC CGGTCGGCCA GGGCGGCATC 
AACGGCAACT ACGGGCGCTA CGAGAACCCC GAGGCCACCG CCGCGCTGGA GCAGTACGCC 
ACCGCGCCCG ACGAGGCCTC CCGCACCGCC GCGATGACCC TGCTCCAGCA GATCTTCGTG 
CGCGACATGC CGGTGGTCAT CACCTCGGCG GCCAACGGCG GCGGCGAGTA CACCACCCGC 
AACTGGACCG GCTGGCCCGA CGCCGAGAAC CCCTACGCGC CCGCCCAGAT GACCCTGGAG 
AACGCGCTGC AGATCGTCCT CAAGCTGAAG CCCGCCGCAT GA

Protein sequence

MRLRRTAALA LAAITAFTPL AACSTSNQGA QSQAGVLNVG KPDGPQTENH NPFLNSSAAT 
IMGYRRLIFE PLTMVNETDA TQEPTPWLAS EWDWQENYSK LVLTVRENVT WSDGKPLTPA 
DVAYTFTLLK NNPGLNIQGL PIDGASVDGG KVTVSFPRSQ FTNRNKLLEQ FVVPEHIWST 
YANPSTETVK NPVGSGPYTL KSFTPQTQTL VARDSYWQEL PQVKEVRYTA YADNNAQTTA 
LANGTTDWSF VFIPNYEAVY TSKDPQHNKL WFPPVLGIHG LWFNTKSAPW DNPALRRAVN 
QVVNRQDIFV QGEGGYFYPK VDNITGIPTP AGDPFIADEF KGRTVEVDVA AAKKELTDNG 
FSYDGDKLKD PSGKPVTLKM TVPSGWSDYV TNVEIIKDNV SDIGVEATVE LQNVDAWTKA 
LDTGDFQAAL HWTNNGPTPY DIYQSIMDGA LYKPVGQGGI NGNYGRYENP EATAALEQYA 
TAPDEASRTA AMTLLQQIFV RDMPVVITSA ANGGGEYTTR NWTGWPDAEN PYAPAQMTLE 
NALQIVLKLK PAA