Gene Smed_2096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2096
Symbol
ID	5322956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2156225
End bp	2157502
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	61%
IMG OID	640791034
Product	glycine hydroxymethyltransferase
Protein accession	YP_001327764
Protein GI	150397297
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.835184
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0355089
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAT ACACGAAGGC TTATTTCAAT GCGCCGGTTC ACGAACGCGA CCCATTGGTC 
GCGCAGGCCA TCGACAATGA ACGCAAGCGC CAGCAGGACC AGATCGAACT CATCGCTTCG 
GAGAACATCG TCAGCCGGGC CGTTCTCGAT GCGCTTGGCC ACGAGATGAC GAACAAGACC 
CTGGAAGGTT ACCCGGGAAA CCGCTTCCAC GGTGGAGGCC AGTTCGTCGA TGTGGTGGAG 
CAGGCCGCAA TCGACCGGGC GAAGCAGCTT TTCGGCTGCG CATATGCCAA TGTCCAGCCG 
CATTCGGGCA CTCAGGCAAA CCTCGCCGTA TTCTTCCTGC TCCTGACGCC GGGGGACAAG 
GTTCTTTCGC TTGACCTTGC GGCAGGCGGT CACCTGTCGC ACGGCATGAA GGGCAATCTT 
TCGGGCCGCT GGTTCGAACC CCACAACTAC AATGTGAACC CGGAAACCGA AGTCATCGAT 
TATGACGAAC TGGAGCGGAT CGCCGAAGAG GTGCGTCCGA CACTCCTGAT CACCGGCGGC 
TCGGCCTATC CGCGCGAACT CGATTTCGAA CGCATGGGCA ATATTGCAAA AAAGGTTGGC 
GCCTGGTTCC TGGTAGACAT GGCGCATATC GCCGGTCTCG TGGCAGGCGG GGTCCATCCT 
TCGCCGTTCC CGCACGCCGA TATCGTCACC TGCACGACGA CCAAGACGCT GCGCGGCCCG 
CGCGGGGGAC TGATCCTCAC CAACAACGAA GCCTGGTTCA AGAAGCTCCA GTCCGCGGTG 
TTCCCGGGGG TCCAGGGATC GCTCCACAGC AATGTGCTGG CGGCCAAGGC GATCTGCCTC 
GGTGAGGCGC TTCGCGACGA TTTCAAGGTC TATGCGGCGC AAGTGAAAAC CAATGCGCGG 
GTTCTCGCCG ATGTCCTCAT GGCCCGTGGA GTACGGGTCG TCTCCGGCGG CACGGACACC 
CACATCGTAC TTGTCGACCT GTCGAGCAAG GGCTTGATCG GCAAGCAGGC CGAGGATCTG 
CTGGCCCGTG CCAACATCAC GGCCAACAAG AACCCGATCC CGAACGACAG CCCGCGTCCG 
CCGGAATGGT TGGGTATGCG CCTCGGCGTC TCCGCGGCCA CGACACGCGG CATGAAGGAA 
GACGAATTCC GAACGCTCGG CACCATCATC GCAGACCTCA TCGAGGCGGA AGCTGCCGGC 
AATGCCGACC TTAGCGTCGA GGCTGCGAAG ACGAAGGTGG CTGAACTGAC GGCTGCCTTT 
CCCGTCTACG GTCACTGA

Protein sequence

MTEYTKAYFN APVHERDPLV AQAIDNERKR QQDQIELIAS ENIVSRAVLD ALGHEMTNKT 
LEGYPGNRFH GGGQFVDVVE QAAIDRAKQL FGCAYANVQP HSGTQANLAV FFLLLTPGDK 
VLSLDLAAGG HLSHGMKGNL SGRWFEPHNY NVNPETEVID YDELERIAEE VRPTLLITGG 
SAYPRELDFE RMGNIAKKVG AWFLVDMAHI AGLVAGGVHP SPFPHADIVT CTTTKTLRGP 
RGGLILTNNE AWFKKLQSAV FPGVQGSLHS NVLAAKAICL GEALRDDFKV YAAQVKTNAR 
VLADVLMARG VRVVSGGTDT HIVLVDLSSK GLIGKQAEDL LARANITANK NPIPNDSPRP 
PEWLGMRLGV SAATTRGMKE DEFRTLGTII ADLIEAEAAG NADLSVEAAK TKVAELTAAF 
PVYGH