Gene Smed_1171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1171
Symbol
ID	5322017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1247627
End bp	1249156
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	64%
IMG OID	640790112
Product	peptidase M23B
Protein accession	YP_001326857
Protein GI	150396390
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.816034
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.264871
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAAT TTGAATCTCC CCAGGCAGGC AAGTCTATGA TCCGTCTCTG CGCGGCTATA 
TTGCTTGCGG GTGTAGCGAC CGGTTGCAGT TCTGACGCCA GCCGCTTCGG CGGGCTCTTC 
TCGCGGTCTG ACGACATAAT GACAGGCTCG ATCCCGCAGG GTTCGAGTAC GATGCCGAGA 
GGCGATGTCG CAAGTGGCGA TGCAGCGCCC TCCTATGGAA ACAGCGCGTC GGTCGGTCAA 
TCCTATCCCG CTGGCGGCGG CTACAATGCG GCAGCGGCGC CGGTCTCCAG TGCTCGTGTC 
GCATCCACGC CTATGGCCGT CCAGCGTACG AGCCTCGACG AGCCGTCCGC CACATCCGGG 
CAGCAGCAGG TTCGGACCGC TTCTCTCGAC TCGCAGGCCG CCGCCCTTCC GAGGTCGCAG 
CCGCAGTCGG GGGGCGCCAG GGATATTCCG AGCAAGGGGG GGTGGAGTGC CTCCAACGCG 
CCGACGATCT TGGTCCGTCA GGGCGACACG GTGACCGTTC TCGCCAGACG GTTCGGCGTC 
CCCGAGAAGG AGATCCTGAG GGCGAACGGA TTGAAATCGT CAAGCCAGGT AGAGCCGGGC 
CAGCGCCTGG TCATTCCGAC GTTTGGCGCC GCGGGCAGCG CCGCGAAGGC GGCTGCATCG 
GGGTCGATCG CCGACGTGGA AGGTGGTAAG AGGCGCCCGT CGCCGCTGCC GACTGATCAG 
CGCGAGGTCG CAATCCTCCC CGGTCAGTCC CAATCTCGCG AAAAGAACGA AAGCCGCAGC 
GATGTGGCCG CAGGCAAGCT CAACAGCGCT GGCGAGGGCG GCGGCACTGG CGGTTATGCG 
GTCAAGCCGG GCGACTCGCT GAACCGGATC GCCAAGGCGA ACGGTGTCTC GGTCGCTGCT 
CTGAAGCAGG CAAACGGGCT TACGACGGAA GCCATCCGCA TCGGACAAAA ACTCAATATC 
CCCAGCGCTT CGGCCAATAC GCCAGCGACC GACGCTGTCG TCACGGCTTC TGTCTCGCCC 
AAGAAGAACG AAGCCAAGGT TGCCGCAACG GAGCAGTCCA AGCCGGCCGA AGCCAAGGCG 
GCTGCCGCCA AGGAGAGCGT GTCCGAAGTC GCCATCAAGT CGGATGTCAA CGAAGATCTC 
CCGAAGTCGA CCGGCATCGG GAAATACCGC TGGCCGGTCC GTGGCGCGGT CGTCGCTGCC 
TATGGCGCCA ATGTCGATGG CAACCGGAAT GACGGTATCA ACATATCGGT TCCGGAGGGT 
ACGCCTATCA AGGCGGCTGA GAACGGCGTC GTGATCTACT CGGGCAGCAG CCTCAAGGAG 
CTCGGCAATG CCGTTCTGGT GCGCCACGAT GACGGTACCG TAACGGTCTA CGGCAATGCT 
GCCGAACTGA AGGTGCAACG CGGTCAGAAG GTCCAGCGCG GGCAGACGCT CGCATCATCA 
GGCATGACGG GCAGGGCATC GCGGCCGCAG GTGCACTTCG AGGTGCGCAA GAATGCGACC 
CCGGTCAACC CGGTGACCTA TCTCGAATAG

Protein sequence

MRKFESPQAG KSMIRLCAAI LLAGVATGCS SDASRFGGLF SRSDDIMTGS IPQGSSTMPR 
GDVASGDAAP SYGNSASVGQ SYPAGGGYNA AAAPVSSARV ASTPMAVQRT SLDEPSATSG 
QQQVRTASLD SQAAALPRSQ PQSGGARDIP SKGGWSASNA PTILVRQGDT VTVLARRFGV 
PEKEILRANG LKSSSQVEPG QRLVIPTFGA AGSAAKAAAS GSIADVEGGK RRPSPLPTDQ 
REVAILPGQS QSREKNESRS DVAAGKLNSA GEGGGTGGYA VKPGDSLNRI AKANGVSVAA 
LKQANGLTTE AIRIGQKLNI PSASANTPAT DAVVTASVSP KKNEAKVAAT EQSKPAEAKA 
AAAKESVSEV AIKSDVNEDL PKSTGIGKYR WPVRGAVVAA YGANVDGNRN DGINISVPEG 
TPIKAAENGV VIYSGSSLKE LGNAVLVRHD DGTVTVYGNA AELKVQRGQK VQRGQTLASS 
GMTGRASRPQ VHFEVRKNAT PVNPVTYLE