Gene Smed_0133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0133
Symbol
ID	5320962
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	146933
End bp	148117
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	63%
IMG OID	640789066
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_001325828
Protein GI	150395361
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.765641
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.668156
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGA ATTGGCGCCC GGCAACCCAG CTCGTCCACG GCGGAACGCT GCGTTCCCAG 
TACGGCGAGA CCTCCGAAGC GATCTTCCTG ACGCAAGGCT TCGTCTACGA CACCTCCGAA 
GCGGCGGAGG CCCGTTTCAA GGGCGAGACT GACGGTTACA TCTATGCGCG TTACGGCAGC 
CCGACCAACG ACATGTTCGA AAAGCGCATG TGCATGCTCG AAGGAGCGGA AGACGCGCGT 
GCAACCGCCT CCGGCATGGC CGCGGTTTCT GCGGCAATCC TTTGCCAGGT GAAGGCTGGA 
GACCATATCG TCGCCGCCCG CGCACTCTTC GGCTCGTGCC GCTGGGTTGT GGAGACGCTG 
GCGCCGAAAT ACGGGGTCGA GTGCACGCTG GTGGACGGCC GCGATCTCAA GAACTGGGAA 
GACGCAGTGC GTCCGAACAC GAAGGTCTTC TTCCTGGAAA GCCCGACGAA CCCGACGCTG 
GAAGTGATCG ACATTGCCGG TGTCGCCAGG CTCGCCGATC AGATCGGCGC CAAGGTGGTG 
GTCGACAACG TCTTCGCAAC GCCGCTCTTC CAGAAGCCGC TGGAGCTCGG CGCCCATATC 
GTCGTCTATT CCGCGACGAA ACATATCGAT GGCCAGGGTC GCTGCCTCGG CGGCGTGGTT 
CTCTCCGACA AGCAGTGGAT CGACGAGAAT CTGCATGATT ACTTCCGTCA CACCGGCCCG 
GCCATGTCGC CCTTCAATGC CTGGACGCTA CTGAAGGGGA TCGAGACCCT GCCGCTACGC 
GTTAGGCAGC AGACCGAGAG CGCCCGCCGC ATCGCCGACT TCCTCACAGA GCAGCCGCAG 
GTCGCACGCG TCATTTATCC GGGCCGCAAG GATCACCCGC AGGCCGACAT TATTGCCAAG 
CAGATGAGCG GCGGCTCGAC GCTGGTCGCC TTCGAACTCA AGGGCGGCAA GGAAGCAGCC 
TTCGCCCTGC AGAACGCGCT GGAAATCGTT CGGATCTCCA ACAATCTGGG CGATTCCAAG 
AGCCTGATCA CCCATCCGGC GACGACGACC CATAAGAACC TTACCGACGA GGCCCGCGCG 
GAACTCGGCA TCTCCGCGGG GACCGTGCGC TTCTCGGCTG GAATCGAGGA TAGTGAAGAC 
CTCGTCGAGG ACTTCGCGAA GGCACTGAGG AGCGTCACGG CCTAA

Protein sequence

MSKNWRPATQ LVHGGTLRSQ YGETSEAIFL TQGFVYDTSE AAEARFKGET DGYIYARYGS 
PTNDMFEKRM CMLEGAEDAR ATASGMAAVS AAILCQVKAG DHIVAARALF GSCRWVVETL 
APKYGVECTL VDGRDLKNWE DAVRPNTKVF FLESPTNPTL EVIDIAGVAR LADQIGAKVV 
VDNVFATPLF QKPLELGAHI VVYSATKHID GQGRCLGGVV LSDKQWIDEN LHDYFRHTGP 
AMSPFNAWTL LKGIETLPLR VRQQTESARR IADFLTEQPQ VARVIYPGRK DHPQADIIAK 
QMSGGSTLVA FELKGGKEAA FALQNALEIV RISNNLGDSK SLITHPATTT HKNLTDEARA 
ELGISAGTVR FSAGIEDSED LVEDFAKALR SVTA