Gene Rleg_0190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0190
Symbol
ID	8011419
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	189146
End bp	190330
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	63%
IMG OID	644822782
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_002974040
Protein GI	241202944
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0949182
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.567401
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGA CCTGGCGCCC GGCAACCCAA CTCGTCCACG GTGGCACGCT GCGTTCGCAA 
TATGGCGAGA CGTCCGAGGC AATCTATCTC ACCCAAGGCT TCGTCTACGA AACGTCCGAG 
GCGGCCGAAG CCCGCTTCAA GGGCGAGACG GAGGGCTTCA TCTACGCCCG CTACGGCAGC 
CCCACCAACG ACATGTTCGA AAAGCGCATG TGCATGCTCG AAGGCGCCGA AGACGCCCGC 
GCCACCGCTT CCGGCATGGC CGCCGTCACC GCGGCGATCC TCTGCCAGCT GAAATCAGGC 
GATCATATCG TCGCCGCGCG CGCCCTGTTC GGTTCCTGCC GCTGGGTCGT CGAGACGCTG 
GCGCCGAAAT ACGGCATCGA CTGCACGCTG ATCGACGGCC GGGATCTGGC GAACTGGGAA 
AAGGCGATCA CGCCGAAGAC CAAGGTGTTC TTCCTGGAAA GCCCGACCAA CCCGACGCTC 
GAAGTGATCG ATATCGCTGG CGTCGCCAAG CTCGCCAACC AGGTCGGCGC CAAGGTCGTC 
GTCGACAATG TCTTTGCCAC GCCACTTTTC CAGAAGCCCC TGGAGCTCGG CGCCCATATC 
GTCGTTTATT CCGCCACCAA GCATATTGAC GGCCAGGGCC GCTGCCTCGG CGGTGTCGTT 
CTTTCCGACA AGGAATGGAT CGACGAGAAC CTGCACGACT ACTTCCGCCA TACTGGGCCG 
GCCATGTCGC CGTTCAATGC CTGGACACTG TTGAAAGGCA TCGAGACGCT GCCGCTGCGC 
GTGCGCCAGC AGACCGAGAA TGCGGCAAAG ATCGCCGATT TCCTGGCCGA GCAGGGCAAG 
GTCGCCAAGG TGATCTATCC CGGCCGCAAG GACCATCCGC AGGCCGATAT CATCGCCAAG 
CAGATGACCG GCGGCTCGAC GCTGGTCGCC TTCGAGCTGA AGGGCGGCAA GGATGCGGCC 
TTTGCGCTGC AGAACGCGCT CGATATCGTC AAGATCTCCA ACAATCTCGG CGACAGCAAG 
AGCCTGATCA CCCATCCGGC GACGACGACG CACAAGAACC TGACGGATGA GGCGCGCGCC 
GAACTCGGCA TTTCCCCGGG CACGGTCCGC CTTTCGGCCG GCATCGAGGA TACCGACGAC 
CTGATCGAAG ATTTCGCCAA GGCGCTTGAC AAGGTCTTGG CCTGA

Protein sequence

MSKTWRPATQ LVHGGTLRSQ YGETSEAIYL TQGFVYETSE AAEARFKGET EGFIYARYGS 
PTNDMFEKRM CMLEGAEDAR ATASGMAAVT AAILCQLKSG DHIVAARALF GSCRWVVETL 
APKYGIDCTL IDGRDLANWE KAITPKTKVF FLESPTNPTL EVIDIAGVAK LANQVGAKVV 
VDNVFATPLF QKPLELGAHI VVYSATKHID GQGRCLGGVV LSDKEWIDEN LHDYFRHTGP 
AMSPFNAWTL LKGIETLPLR VRQQTENAAK IADFLAEQGK VAKVIYPGRK DHPQADIIAK 
QMTGGSTLVA FELKGGKDAA FALQNALDIV KISNNLGDSK SLITHPATTT HKNLTDEARA 
ELGISPGTVR LSAGIEDTDD LIEDFAKALD KVLA