Gene Smed_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1040
Symbol
ID	5321886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1109818
End bp	1111302
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	62%
IMG OID	640789983
Product	Serine-type D-Ala-D-Ala carboxypeptidase
Protein accession	YP_001326728
Protein GI	150396261
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1686] D-alanyl-D-alanine carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.183484
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATGA AGAGCAATAC AGTGTCTCAA TCCGTTATTC CCAGTCTCGC GAAACGCCCG 
TATGGCGCCA TTTCAGAAGT TGTCGGGCGG ATTTTCCTCG CCGGCCTGAT TGTCGTGCTG 
ACCCTTTCAG CGCCCGCTCT CGCCAATTCG AAATATGCCG GCATCGTAGT TGACGCGAAG 
ACCGGCAAGG TTCTCTACGG CGAAGACGCG GATCAATTGC GCTACCCCGC CTCGCTTACG 
AAGATGATGA CGCTGTATCT GACATTCGAG GCGCTTGAAG CGGGTCGGAT CAACAAGAGC 
ACGCCCGTAC CATTTTCAAA GAAAGCTTCG GCGGAGCCGC CGTCGAAGCT CGGGGTACGC 
GCCGGCCGGT CGATCACCGT CGAACAGGCT ATTCTCTCTC TGGTGACGCG CTCGGCCAAC 
GATTCGGCAA CTGCCCTTGC TGAACTCCTC GGCGGCTCGG AACAGCGCTT CGCCCGGATG 
ATGACCAACA AGGCCCGCGC GTTGGGAATG ACGCGCACGA CTTATCGCAA CGCCCACGGC 
CTGCCCAATT CCGAACAGCG CACGACTGCA CGCGACCAGG CCCGCCTCGG CATCGCATTG 
CGGCAGCACT TCCCGCAGTA TTACGATTAT TTCTCGACGC GAAGCTTCCG TTTCGGCAAG 
CAGACGATCG GCAATCATAA CCGGCTCCTT GGTAATGTCC GGGGAGTGGA CGGCATCAAG 
ACCGGGTATA CGCGCGCTTC CGGGTTCAAT CTGGTGACCT CCGCCCAACT CGGCGGACGC 
AGCATCGTCG CGGTTGTCAT GGGCGGCACC TCCGGCGGTT CGCGCGACGC CCAGATGCGC 
AAGCTGGTAG CCAAGTACAT GCCCGCCGCA TCGCGCCGCG GCGGCGGCAA CCTTATCGCC 
CAGGCTCCCG CCGAGCCTGT AGCAGTGGTC GCCGAAGCGG ACGTGCGGCC GGCCACGACG 
GCTGTTGCTT CGGCCGCCGC CGCCCTGCCG AATAAGGGCC CTGTCCCGGA TTTCCGGTAC 
GATAGCGAAA GCGCAGGCGG AGTTGAAATG GCCTATGCAT CGACGAAGCG CGCTTCGGAC 
AATCCCGTGC TCGCACCGAA CACGCTCGAC GCGCAGAGCG CCAGACTCGG CCGGGAACCG 
GAATCCGGCG GCGTCGACTC GCAGATCACC AACTCGGTCG CAACGGCGGA AACGGCACCG 
GCCATGGCTG AAGCCCACAC CGAAGCGAAT ATCGAACTGC AAGGCTGGGT GATCCAGATC 
GGCGCCACGC CTGACAAGAC GCAGGCCATG ACGCTGCTCG ACAATGCCAA GGAAAAGGGT 
GGAAAGGCGC TGCGTAACGC CACCCCCTTC ACGGTCGCGT TCAGCAGTGG CGGCGCTCAG 
CTCTACCGCG CCCGTTTCGG CGGATTCGAT GATCAGGACA AGGCTGTCAA CGCATGCAAG 
GCATTGAAGA AGAAAGGCTT CGCCTGCTGG GCAAGCCAGC AGTAA

Protein sequence

MTMKSNTVSQ SVIPSLAKRP YGAISEVVGR IFLAGLIVVL TLSAPALANS KYAGIVVDAK 
TGKVLYGEDA DQLRYPASLT KMMTLYLTFE ALEAGRINKS TPVPFSKKAS AEPPSKLGVR 
AGRSITVEQA ILSLVTRSAN DSATALAELL GGSEQRFARM MTNKARALGM TRTTYRNAHG 
LPNSEQRTTA RDQARLGIAL RQHFPQYYDY FSTRSFRFGK QTIGNHNRLL GNVRGVDGIK 
TGYTRASGFN LVTSAQLGGR SIVAVVMGGT SGGSRDAQMR KLVAKYMPAA SRRGGGNLIA 
QAPAEPVAVV AEADVRPATT AVASAAAALP NKGPVPDFRY DSESAGGVEM AYASTKRASD 
NPVLAPNTLD AQSARLGREP ESGGVDSQIT NSVATAETAP AMAEAHTEAN IELQGWVIQI 
GATPDKTQAM TLLDNAKEKG GKALRNATPF TVAFSSGGAQ LYRARFGGFD DQDKAVNACK 
ALKKKGFACW ASQQ