Gene Amir_2223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_2223
Symbol
ID	8326412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	2458685
End bp	2459815
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	78%
IMG OID	644942769
Product	peptidase M50
Protein accession	YP_003100010
Protein GI	256376350
COG category	[R] General function prediction only
COG ID	[COG1994] Zn-dependent proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGACTG CGGAGGGCTG GCGGGCGAGG GCGGGCCGGG AGGGCGGTCT GCCGCTGTTC 
CGCGCCGCGG GCATCCCGGT GCTGCTGGCG CCCTCGTGGT GGTTGGGCTC GGCGGTCATC 
GTCGTGCTGT ACGCGCCGCT CGCGAGCCGG ATCAGCCCGG ACGCAGGCGG CTTCACCGGC 
CTGGCGCTCG CCGCCGCGTT CGCGCTGTTC CTTGGCCTGT CCGTGCTGGC CCACGAGCTG 
GGCCACAGCC TGGTCGCGCT GCGCCTGGGC CTGCCGGTGC GCAGGCTGCG GCTGTTCCTG 
CTCGGCGGGG TCTCCGAGGT GGCCAGGGCC CCCGGCACCC CGCGCCACGA GGGCCTGGTC 
GCGGCGGCGG GACCGCTGGT GTCCGTGCTG CTCGCGGGCG TGTTCGCGCT CGGCGCCCAC 
GCCATCCCGA CCACCGACGC GGTGTGGCTG CTGGTCGCGC AGACCTCGTT CGCCAACGCC 
GCCGTCGCCG TGTTCAACCT CCTGCCGGGC CTGCCGCTGG ACGGCGGGCG CATCCTGCGC 
GCGGGCGTCT GGGCCATCAC CGGCAAGCGC GCCACCGGCA CCAGGGCCGC CGTCATCGGC 
GGTGGGCTGG TGGCCGCGCT CCTGGTGGTC TGGGCGGTGC TCGGGCTGCT CGACGGCGCG 
CCGGACCGCT GGCTGCGCTT CGGCGTGTGC CTGCTCACCG CCTGGTTCGT GGTCGCGGGC 
GCGCGCGGCG AGTCGGCGGC CGAGCGGGCC AGGGCCTGGC CGGAGGGGCT CACCCTGCAG 
CAGCTCGTGC GCCCGGTGCT CCAGCTGCCC GCCGAGAGCC CGGTGTCCGG CGCGCTGTCG 
GCCGCCGCCG GGCGCGGGGT GGTGCTGGTG CGCGCCGACG GGGTCGCCGC CGGGCTGCTG 
GACCGGACCC TGGCCGAGCG CCTGGCCAGC ACGTCCCCGC ACGCGCCCGC CGAGCAGGCC 
GCCGTGCCGA TCCGGCCGGA GACCGTGCTG CTCGCCGACG AGGCCGGGGA CGACGTGGTC 
GAGCGGGTCC AGGGGACGGC GGCGCGCGAG TACCTGGTGG TCGACCTGGA GGGCAGGCCC 
GCCGGGGTGC TGCGCCGAGA GGACCTCAAG GCCGCGCTGG AGAGCCGCTA G

Protein sequence

MATAEGWRAR AGREGGLPLF RAAGIPVLLA PSWWLGSAVI VVLYAPLASR ISPDAGGFTG 
LALAAAFALF LGLSVLAHEL GHSLVALRLG LPVRRLRLFL LGGVSEVARA PGTPRHEGLV 
AAAGPLVSVL LAGVFALGAH AIPTTDAVWL LVAQTSFANA AVAVFNLLPG LPLDGGRILR 
AGVWAITGKR ATGTRAAVIG GGLVAALLVV WAVLGLLDGA PDRWLRFGVC LLTAWFVVAG 
ARGESAAERA RAWPEGLTLQ QLVRPVLQLP AESPVSGALS AAAGRGVVLV RADGVAAGLL 
DRTLAERLAS TSPHAPAEQA AVPIRPETVL LADEAGDDVV ERVQGTAARE YLVVDLEGRP 
AGVLRREDLK AALESR