Gene Smed_5532 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5532
Symbol
ID	5319834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	497144
End bp	498175
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	60%
IMG OID	640777283
Product	D-cysteine desulfhydrase
Protein accession	YP_001314215
Protein GI	150377620
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2515] 1-aminocyclopropane-1-carboxylate deaminase
TIGRFAM ID	[TIGR01275] pyridoxal phosphate-dependent enzymes, D-cysteine desulfhydrase family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.1518
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGACCG ACCGAGATCC TTTGCAGAGC TTTCCCCGTG AGCGACTGAT GAAAGGTCCA 
ACGCCGATCC AGCGCTTGGC GCGTCTCGAA GAAGTTCTGG GCGAACGGAG TAGGGGCGTA 
TCGATCTGGG CCAAAAGAGA TGATCTCATG GAACTCGGCG GCGGCGGCAA CAAGCTCCGC 
AAGCTTGAAT TCCTCCTCGG GCAGGCGAAA GCGGAGGGAT GTGACACCCT CGTCGTAACG 
GGAGGAGTTC AATCCAACTT CGCACGATTG GCCGCCGCAG CGTGCGCCAG GTCGGGGCTC 
GCCTGCGAGC TCGTTCTTGC TCAGATGGTA CCTCGGACGA CCGAAATTTA TCAGGACAAC 
GGCAATGTGC TTCTCGACCG TCTGTTTGGC GCCAGCGTTC ATATACTGGA CCCGGATGAA 
GATGCTGGCG CGTATGCGAG GCGTCGGGTC GATGAGATCG CCGAAACTCG CAGGAGAGCT 
CTTCTGGCGC CTCTCGGCGG CTCAACGACA ATCGGTTGCC TCGGTTACGT GGATTGCGCT 
TTCGAACTCG CCCGGCAATC GGCTGAAACG GGTGTTGCGT TCGAGCAGAT CATCATCCCC 
AACGGCAGCG GCGGCATGCA TGCCGGGTTG GCTGCTGGCG TGGTCGTTGC GGGGTCTCAC 
CCTTCTCGGA TCGCCGCATA CACCGTGCTC TCGCCTGCAG ACAAGTGTCT CCTCGCAACT 
GCGGACAAGG TCAACGCGGT TCTTGAGCGA CTGGCCAGCG ACGCTCGCGT GACCGCGGAC 
GATCTCCGGA TAAGCAGTGC TCAACTGGGC GAAGGATACG GCATGCCGAC TTCCGGCATG 
ATCGACGCGG TCGAACTTCT CGCGAGATCA GAAGGGCTTC TCGTCGATCC GGTTTACGGC 
GGCAAGGCCT TGGCAGGGTT GCTGTCCGAC GTTGAAAGTG GGGCAATCGC ACCGCAGTCT 
AACGTGCTCT TCATCATGAC CGGAGGTTCG CCCGGACTTT ATGCATACGC CGACGTTCTC 
ACTTCCAAGT AG

Protein sequence

MMTDRDPLQS FPRERLMKGP TPIQRLARLE EVLGERSRGV SIWAKRDDLM ELGGGGNKLR 
KLEFLLGQAK AEGCDTLVVT GGVQSNFARL AAAACARSGL ACELVLAQMV PRTTEIYQDN 
GNVLLDRLFG ASVHILDPDE DAGAYARRRV DEIAETRRRA LLAPLGGSTT IGCLGYVDCA 
FELARQSAET GVAFEQIIIP NGSGGMHAGL AAGVVVAGSH PSRIAAYTVL SPADKCLLAT 
ADKVNAVLER LASDARVTAD DLRISSAQLG EGYGMPTSGM IDAVELLARS EGLLVDPVYG 
GKALAGLLSD VESGAIAPQS NVLFIMTGGS PGLYAYADVL TSK