Gene Amir_2666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_2666
Symbol
ID	8326855
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	2999243
End bp	3001096
Gene Length	1854 bp
Protein Length	617 aa
Translation table	11
GC content	69%
IMG OID	644943206
Product	extracellular solute-binding protein family 5
Protein accession	YP_003100447
Protein GI	256376787
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.955399
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACGG CACAGTCCGC CACCGACCTG GCCACGACCG ACCCGACCGC CGCCGACCCG 
ACCGCCGCAC CCGCCGGGGA CGTCCCCCGC AAGGGCGGGG TCGTCACCTG GGCCTGCGCG 
CCGGGCTTCC CGCCCGCCGT GATCTTCCCG TTCACGCCCG CCGAGCGCAT GGGCACCCGC 
AACATCCTGG AGTTCCAGGC CCTGATGTAC CGGACGCTGT ACTACTTCGG CAGCGACGGC 
ACCCCGAACG TCGACTACCA CCAGAGCATC GGCGAGGAGC CGGTGTGGAG CGAGGACGGC 
CGCACCGCGC GCGTGCGCAT CAAGCCGTGG AAGTGGTCCA ACGGCGAGAC CGTCTGCGCC 
GACAACGTGC TGTTCTGGGT GAACCTGATG AAGGTCAAGG GCCCCAGGTA CGGCGAGTAC 
GTCCCCGGCT ACTTCCCGGA CAACCTCACC GAGTACGGCA AGCTCGCCGA CGACGAGGTG 
TTCTTCACCT TCGACAAGCC CTACTCCAAG CACTGGGTGC TGCACAACCA GCTCAGCACC 
ATCACCCCGC TGCCCAAGGC GTGGGACCGC ACCGCCGACG GCCCGGCCAA CGCCTCCGGC 
GACCTCGCCG ACGTCGAGGC CGTCTACGAG CACCTGATGG CCGAGCAGGG CGACATCATC 
AACGAGGGCA ACGAGCACCG CACCAGGTGG GCCGACAGTC CCGTGTGGAG CGTCGTCTCG 
GGGCCGTGGC GGCTCAAGAG CTACACCCTC GAAGGCGTCG TCACCTTCGT CCCCAACGAG 
CACTACTCCG GCCCGAACAA GCCGCACCTG GACGAGTTCC GCCAGATCCC GACCTTCTCC 
GACGAGGAGC AGTACGAGGT CCTCAAGAAG GGCCCGGACG CCGAGGGCGG CTTCCAGGTC 
GGCTACCTGC CGCTCAGCTT CGCCACCGAG CCCGCCGTGG ACCCGGTCGT CGGCGGCCCG 
AACCCGCTGG CCGAGCACTA CACGATGCAC CCGCAGACCG CGTTCTGCAT CCGGTACATC 
TCGCTCAACT ACAACAACCC CACCGTCGTC GGGAAGATGT TCGCCCAGAC CTACCTGCGC 
CAGGCGCTGC AGAGCGTCCT GGACCAGGAC ACCGCCGTCC GCGACATCTA CCAGGGCTAC 
GCCTACCGGC AGAACGGCCC CGTCCCGATG TACCCGAGGA CCGAGTACGT CTCCCCGCGC 
CAGCGCGAGG GCGCCTGGCC GCTCCCGTTC GACCCCAAGC ACGCCAAGGA GCTGCTGGAG 
GCCAACGGCT GGGACACCAG CCGGACCCCT GCGGTGTGCG TGCGCGCCGG AACCGGACCG 
GGCGAGGCGG GGGAGGGCAT CCCCGAGGGA ACCGAGCTCA CCCTGCTCAT GCGCTACGTC 
GAAGGCAGGC CCGCGCTCAC CAGGCTCATG GAGGGCTTCC GCGACGCCGC CGCCGAGGCG 
GGCATCGAGC TGCGCCTGCG CGAGATCTAC GGCTCCGTCC TGGTCGCCGA GGACGCGCCG 
TGCGTGCCCA CCGAGGAAAC CCCCTGCCTG TGGGAGATGT GCTGCTGGAA CGGCGGCTGG 
GCCTACCACC ACCCGACCGG CGAGATCCTC TTCTCCACCG GCGCGGGCGG CAACTTCGGC 
TTCTACACCG ACCCCGAGGC CGACGCGCTC ATCGAGCGCA CCGTCACCAC CGACGACCTC 
GACGTCCTCT ACGAGTACCA GGACTACATC GCCGAGCAGG TGCCGGTGAT CTTCACGCCG 
AACTTCCCCA TCCGGCTCTT CGAGGTCGCC AACAACCTCA GGGGCTTCGG GCCGATCAAC 
CCCTACGGCA TGATCAACCC GGAGAACTGG TACTACGCCG AGGACCCGGC GTGA

Protein sequence

MTTAQSATDL ATTDPTAADP TAAPAGDVPR KGGVVTWACA PGFPPAVIFP FTPAERMGTR 
NILEFQALMY RTLYYFGSDG TPNVDYHQSI GEEPVWSEDG RTARVRIKPW KWSNGETVCA 
DNVLFWVNLM KVKGPRYGEY VPGYFPDNLT EYGKLADDEV FFTFDKPYSK HWVLHNQLST 
ITPLPKAWDR TADGPANASG DLADVEAVYE HLMAEQGDII NEGNEHRTRW ADSPVWSVVS 
GPWRLKSYTL EGVVTFVPNE HYSGPNKPHL DEFRQIPTFS DEEQYEVLKK GPDAEGGFQV 
GYLPLSFATE PAVDPVVGGP NPLAEHYTMH PQTAFCIRYI SLNYNNPTVV GKMFAQTYLR 
QALQSVLDQD TAVRDIYQGY AYRQNGPVPM YPRTEYVSPR QREGAWPLPF DPKHAKELLE 
ANGWDTSRTP AVCVRAGTGP GEAGEGIPEG TELTLLMRYV EGRPALTRLM EGFRDAAAEA 
GIELRLREIY GSVLVAEDAP CVPTEETPCL WEMCCWNGGW AYHHPTGEIL FSTGAGGNFG 
FYTDPEADAL IERTVTTDDL DVLYEYQDYI AEQVPVIFTP NFPIRLFEVA NNLRGFGPIN 
PYGMINPENW YYAEDPA