Gene Smed_1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1037
Symbol
ID	5321883
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1107368
End bp	1108768
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	61%
IMG OID	640789980
Product	L-serine dehydratase 1
Protein accession	YP_001326725
Protein GI	150396258
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1760] L-serine deaminase
TIGRFAM ID	[TIGR00720] L-serine dehydratase, iron-sulfur-dependent, single chain form

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTCTTT CCGTCTTCGA CGTATTCAAG ATCGGTATCG GCCCGTCGAG CTCACATACG 
ATGGGGCCGA TGTCGGCGGC GAACAGGTTT CTCGATCTTA TTCTTTCGGA CGAATGGCCG 
CGGCCCTCCA ACGCAGCTGT TGCCGCTATC CAGGTCAGCC TTCATGGTTC GCTGGCGCAT 
ACGGGAATCG GCCATGGATC GGGCAGGGCG GTTATTCTCG GCCTGATGGG CGAACGCCCC 
GATCTCGTGG ATCCGGACAA GATGGACGAG GTAATCGAGG AGGTGGAGCG CACAGGGCGT 
ATCACGCCGC CTGGACATCC TTCCTATGCA TTCCAGCCTA AGGCGGATCT GGTTTTCGAC 
AAGAAGATGG CGCTGCCTGG CCATGCCAAC GGCATGTCCT TCTCCGCCTT CGACCGCGAC 
GGCCGGCTGC TTCTGAAACG CATCTACTAT TCGATCGGTG GCGGCTTCGT CGTTACTGAT 
ACGGAGCTCG GCGCGATGAG AGCTCAGAAG AACAAGACGG CCGGCGTCAA AGTGCCGTAT 
CCCTTTGCCA CCGCACAGCA GATGCTCGAC ATGGCCGCCC GTTCCGGAAT GAGCATCGCT 
CAGATGAAAC GGGCCAACGA AGAATGCAGC ATGTCGAGGC AGGAGCTCGA CAACGGGCTC 
GACCGCATTT GGGCGGCAAT GAACAGTTGC ATCGACCGCG GGCTCAGCCA GGACGGCATC 
ATGCCGGGCG GGCTAAAGGT TCGCCGCCGC GCCAGGGCAA TCCACGACAA GCTCCAGGAG 
GAGTGGCGTT CCAACAAGGT TAATCCTCTA CTCGCCAACG ATTGGCTGAG CGTCTATGCG 
ATGGCGGTCA ACGAGGAGAA TGCCGCCGGT GGCCGGGTGG TGACGTCGCC TACGAACGGG 
GCGGCAGGTG TCGTCCCGGC GACGATCCGC TACTATCTTC ATTTTCACGA GGATGCCGAC 
CAGGACGGTA TCCGCGACTA TCTGCTGACT GCCGCGGCGG TTGGCGGTAT CATAAAGCAC 
AACGCCTCTA TTTCCGGGGC GGAGGTCGGC TGTCAGGGCG AAGTTGGATC CGCGTCGGCG 
ATGGCCGCCG CGGGCCTTGC AGCGGTGATG GGCGGAACGC CGGAGCAGAT CGAGAATGCG 
GCCGAAATCG CCCTCGAACA CCACCTTGGA ATGACCTGCG ATCCGGTCGC AGGCCTCGTC 
CAGGTGCCTT GCATCGAGCG TAACGCCCTT GGTGCCGTCA AGGCGGTCAC GGCCGCCTCG 
CTCGCCCTTA AGGGCGATGG CAAGCATTTC GTGCCGCTCG ATGCCTGTAT CGAGACGATG 
CGCCAAACCG GCGTGGACAT GAACGAAAAG TACAAGGAAA CATCGACGGG CGGTCTCGCG 
GTCAACGTCG TGGAGTGTTA A

Protein sequence

MFLSVFDVFK IGIGPSSSHT MGPMSAANRF LDLILSDEWP RPSNAAVAAI QVSLHGSLAH 
TGIGHGSGRA VILGLMGERP DLVDPDKMDE VIEEVERTGR ITPPGHPSYA FQPKADLVFD 
KKMALPGHAN GMSFSAFDRD GRLLLKRIYY SIGGGFVVTD TELGAMRAQK NKTAGVKVPY 
PFATAQQMLD MAARSGMSIA QMKRANEECS MSRQELDNGL DRIWAAMNSC IDRGLSQDGI 
MPGGLKVRRR ARAIHDKLQE EWRSNKVNPL LANDWLSVYA MAVNEENAAG GRVVTSPTNG 
AAGVVPATIR YYLHFHEDAD QDGIRDYLLT AAAVGGIIKH NASISGAEVG CQGEVGSASA 
MAAAGLAAVM GGTPEQIENA AEIALEHHLG MTCDPVAGLV QVPCIERNAL GAVKAVTAAS 
LALKGDGKHF VPLDACIETM RQTGVDMNEK YKETSTGGLA VNVVEC