Gene Rleg2_5074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5074
Symbol
ID	6978168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	719894
End bp	721105
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	59%
IMG OID	643394212
Product	Cystathionine gamma-synthase
Protein accession	YP_002279030
Protein GI	209547112
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.131911
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAAG ACGTGTTGAA TGATGACGAT GGCGATCAGG CTGGTTTCGA TCTTGGATTT 
GCCACGCGTG CCATATTGGG CGGCCAGGCA ACCACGCTCG CTCCGGCAGG CACGCGTGGC 
AGAACCATCC CCCTTTGCGG TCGTTTAATC GACGATCATG ATCGCATCGG ATCGTCTTCG 
ACCAAACAGG GGGACATCTC CATCGCTGCA AACGCCGGGC TGGCGTCAAA CCTCGCAGGT 
CTCGAGGGCG CTGAAGCGGG ATTGGTCTCG GGCTCTGGGC TCGCGGCACT CACCACCCTT 
TTTCGGGCGA CGACATCCCC AGGGGATCGC GTCCTCGTGC AAAAATCTGC GTGCACGGCG 
ACCACCGCCC TCATGCAGGC GACGCTTTCC AGCATGAAGG TAGAAATGGC GGTCGTAGAC 
TTTGCCGCCG AACTAGAGCT GCAAAACGAC CTAAACGGCC GTACGCGGCT CGTCTATCTC 
CAGACACCAA GCGATCCGTT GAGCGGCATC GTCGATATCA CCGCCGTGTG CGCACAAGCG 
CACGAGCACG GACTGACCGT CGCGGTAGAC AACACGTTCG CCTCCCCCGT CCTTCAACGG 
CCGATCGAAC ATGGCGCCGA TGTCGTCTTC CATTCCTTTG CAAAATACAT CAACGGTCAC 
GGCGATGCGG TCGGTGGGGG CGTTTTCGGG GACCGCGATC TGATCTTGCG GATGCAAGAG 
ATGGCGGCGG GCATTGGCAA TCAGACTGGT CTCAACCTCG ATGCGGCGCA TCTGATCCAG 
CGCGGCCTCA AGACCCTGGC GCTTCGTATG GAAAAGCACA GCTCGTCAGC CCATGCCGTT 
GCCCTGACGC TGGAATCGCA TCCGGCCGTA AACTGGGTCC GCTATCCGTT TCTTTCATCC 
CACCCTTACG CGGCCACCGC AAGGCGCCAG ATGACGGGAG GCTCAGGCAT GATTGCCTTT 
GGCCTCAACG CTGGCGACAT TGCAACCCGT CACGTCGTCG AAAGACTTCG TCTGTTTAGA 
CCGTCTATCG CATCAGGCGA GGTAGGAAGT CTCGTCTGCA CGTCTGCAGA TCTATCTAGC 
GCCCGTAACA TTTCGCTTGA AGGGTCAGAG CTATGCGAGA CGCTCGGACA GGACGTTATC 
CGGTTATCCG TCGGTCTGGA AGATGCCGAG GACCTTGTCG AAGATCTCTT CGAAGCCCTC 
TCTGGCCTTT GA

Protein sequence

MTKDVLNDDD GDQAGFDLGF ATRAILGGQA TTLAPAGTRG RTIPLCGRLI DDHDRIGSSS 
TKQGDISIAA NAGLASNLAG LEGAEAGLVS GSGLAALTTL FRATTSPGDR VLVQKSACTA 
TTALMQATLS SMKVEMAVVD FAAELELQND LNGRTRLVYL QTPSDPLSGI VDITAVCAQA 
HEHGLTVAVD NTFASPVLQR PIEHGADVVF HSFAKYINGH GDAVGGGVFG DRDLILRMQE 
MAAGIGNQTG LNLDAAHLIQ RGLKTLALRM EKHSSSAHAV ALTLESHPAV NWVRYPFLSS 
HPYAATARRQ MTGGSGMIAF GLNAGDIATR HVVERLRLFR PSIASGEVGS LVCTSADLSS 
ARNISLEGSE LCETLGQDVI RLSVGLEDAE DLVEDLFEAL SGL