Gene Smed_3237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3237
Symbol
ID	5324116
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	3411810
End bp	3413030
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	62%
IMG OID	640792185
Product	tryptophan synthase subunit beta
Protein accession	YP_001328896
Protein GI	150398429
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATCAGC CGCCTAAACC GAATTCCTTC AGATCCGGAC CCGATGAAGA GGGCCGTTTC 
GGCATATTCG GTGGCCGCTT CGTCGCCGAG ACGCTGATGC CGCTGATCCT CGACCTCCAG 
GACGAATGGG CGAGGGCAAA GAATGATCCG GCTTTCAAGG CGGAGCTGGA AAATCTCGGC 
AGGCATTATA TCGGCCGGCC GAGCCCGCTC TATTTCGCCG AGCGCCTGAC GGCCGAACTC 
GGCGGCGCGA AGATCTACTT CAAGCGCGAG GAGCTCAATC ACACGGGCTC CCATAAGATC 
AATAACTGCA TCGGCCAGAT CCTGCTTGCC AAGCGCATGG GCAAGACCCG CATCATCGCC 
GAGACCGGCG CCGGCCAGCA TGGTGTGGCA TCGGCCACCG TGGCGGCGCG TTTCGGGCTG 
CCTTGCGTCG TCTATATGGG GGCGACAGAC GTGGAGCGGC AGGCACCGAA CGTCTTCCGC 
ATGAAGCTTC TCGGCGCCGA GGTGAAGCCG GTGACTGCGG GTCACGGCAC CCTCAAGGAC 
GCCATGAACG AGGCGCTGCG GGACTGGGTG ACCAATGTCG ACAGCACCTA TTACCTGATC 
GGCACGGCCG CCGGCCCGCA TCCCTATCCG GAGATGGTAC GCGACTTCCA GGCGGTCATC 
GGCGAGGAAG CCAAGCAGCA GATGCTCGAA GCCGAAGGCC GGCTTCCGGA CCTCGTGGTT 
GCAGCGGTCG GCGGTGGGTC AAATGCGATA GGCATCTTCC ATCCATTCCT GGATGACGGG 
GGCGTCAGGA TCGTCGGCGT TGAAGCCGGT GGCAAGGGCC TGGACGGCGA TGAGCATTGC 
GCCTCTCTCA CAGCCGGCTC GCCGGGCGTG CTGCATGGCA ACCGCACTTA TCTGCTCCAG 
GACGGTGACG GCCAGATCAA GGAAGGCCAC TCGATTTCGG CCGGGCTCGA TTACCCGGGG 
ATCGGACCGG AGCATGCCTG GCTGAACGAT ATCGGCCGCG TCGAATATGT GCCGATCATG 
GATCATGAGG CGCTGGAGGC GTTTCAGATC CTGACGCGGC TCGAAGGCAT CATTCCGGCG 
CTCGAGCCGT CCCACGCGCT TGCCGAAGTC ATCAAGCGTG CGCCGAAAAT GGGCAAGGAC 
GAGATCATCC TGATGAATCT CTCCGGTCGC GGCGACAAGG ACATCTTCAC CGTCGGCAAA 
ATTCTCGGTA TGGGGCAATA A

Protein sequence

MNQPPKPNSF RSGPDEEGRF GIFGGRFVAE TLMPLILDLQ DEWARAKNDP AFKAELENLG 
RHYIGRPSPL YFAERLTAEL GGAKIYFKRE ELNHTGSHKI NNCIGQILLA KRMGKTRIIA 
ETGAGQHGVA SATVAARFGL PCVVYMGATD VERQAPNVFR MKLLGAEVKP VTAGHGTLKD 
AMNEALRDWV TNVDSTYYLI GTAAGPHPYP EMVRDFQAVI GEEAKQQMLE AEGRLPDLVV 
AAVGGGSNAI GIFHPFLDDG GVRIVGVEAG GKGLDGDEHC ASLTAGSPGV LHGNRTYLLQ 
DGDGQIKEGH SISAGLDYPG IGPEHAWLND IGRVEYVPIM DHEALEAFQI LTRLEGIIPA 
LEPSHALAEV IKRAPKMGKD EIILMNLSGR GDKDIFTVGK ILGMGQ