Gene Smed_3345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3345
Symbol
ID	5324229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	3545188
End bp	3546408
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	66%
IMG OID	640792296
Product	phosphopentomutase
Protein accession	YP_001329001
Protein GI	150398534
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1015] Phosphopentomutase
TIGRFAM ID	[TIGR01696] phosphopentomutase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGCG CCTTCCTTTT CGTCCTCGAT TCCTTCGGCA TCGGCAATGC GCCGGACGCG 
GGGGCTTTCG GCGATCTCGG CGCCGATACG CTCGGACACA TAGCGGAATT CTGCGCGGCC 
GGGGCCGCCG ACCGGGCGGG CCTCAGGGAA GGGCCGCTCA ATCTGCCAAA CATGTCAGCG 
CTGGGCCTCA TGCATGCGGC GCGGCTGGCG ACCGGTCGGC TGCCCGCCGG CATGGCGCTG 
CCGGAGCGCG TTTACGGCGT CTACGGCGCC GCCAGTGAAG TCTCGCGCGG CAAGGACACG 
CCGTCCGGCC ATTGGGAAAT CGCCGGCACG CCGGTGACCT TCGACTGGGG CTATTTCCCC 
GCGGACGGCG ACGCCTTCCC TCCCGAACTC GTCGAGGCGA TCTGTCGCGA GGGCGACGTG 
CCCGGCATTC TCGGCAATTG CCATGCCTCG GGCACCGATA TCATCGCGCG TCTCGGCGAA 
GAGCATATGC GGACCGGCAA GCCGATCTGC TATACCTCGT CGGACTCGGT CTTTCAGATT 
GCCGCACACG AACAGACCTT CGGTCTGGAG CGTCTGCAGG ACCTTTGCGC GGTCGTCCGC 
CGGCTCGTCG ACGAGTACAA TATCGGCCGT GTGATCGCTC GCCCGTTCGT CGGCAGCGAT 
CCGGGCAGCT TCACGCGCAC CGGCAATCGG CGGGATTATT CGGTGCTGCC GCCGGCACCG 
ACCGTTCTCG ACCGACTGAA GGAGGCCGGG CGAACAGTGC ACGCAATCGG CAAGATCGCC 
GACATCTTCG CGCATCAGGG TGTAACCAGG CTTACCAAGG CCAACGGCAA CATGGCTCTG 
TTCGACGCAA GCCTGGCGGC GATCGACGAG GCCGAGGACG GCGCGCTCAT CTTCACCAAT 
TTCGTCGATT TCGATATGCT CTACGGTCAT CGCCGCGACG TGGCCGGCTA TGCCGCAGCG 
CTCGAAGCCT TCGATGCACG CCTTCCCGAT CTCGACCGCC GCCTGAAGCC CGGCGACATG 
GTCATCCTGA CTGCCGACCA TGGCTGCGAC CCGACCTGGC GCGGCACCGA CCACACCCGC 
GAGCGCGTGC CCGTTCTGAT GTTCGGACCG ACGCTTCGGA GCCGCTCCGT CGGTATTGTC 
GGGAGCTTCG CACATATCGG TGAAACCGTT GCAAGTCATC TCGGAATTGA CCCCGGCCCG 
CATGGGAGGA GCCTCATTTG A

Protein sequence

MARAFLFVLD SFGIGNAPDA GAFGDLGADT LGHIAEFCAA GAADRAGLRE GPLNLPNMSA 
LGLMHAARLA TGRLPAGMAL PERVYGVYGA ASEVSRGKDT PSGHWEIAGT PVTFDWGYFP 
ADGDAFPPEL VEAICREGDV PGILGNCHAS GTDIIARLGE EHMRTGKPIC YTSSDSVFQI 
AAHEQTFGLE RLQDLCAVVR RLVDEYNIGR VIARPFVGSD PGSFTRTGNR RDYSVLPPAP 
TVLDRLKEAG RTVHAIGKIA DIFAHQGVTR LTKANGNMAL FDASLAAIDE AEDGALIFTN 
FVDFDMLYGH RRDVAGYAAA LEAFDARLPD LDRRLKPGDM VILTADHGCD PTWRGTDHTR 
ERVPVLMFGP TLRSRSVGIV GSFAHIGETV ASHLGIDPGP HGRSLI