Gene Smed_3883 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3883
Symbol
ID	5318563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	339156
End bp	340259
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	61%
IMG OID	640775695
Product	myo-inositol-1-phosphate synthase
Protein accession	YP_001312628
Protein GI	150376032
COG category	[I] Lipid transport and metabolism
COG ID	[COG1260] Myo-inositol-1-phosphate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.397744
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGATCGA AATCCATTCG CGTCGGCTTG GTCGGTATCG GGAATTGCGC ATCCTCGCTC 
GTTCAAGGGC TGACATTCTA TCGCGACGCG AAGGAGGACG AGCCGGTTCC GGGACTGATG 
CATGCCAATC TCGGCGGGTA CCACGTCGGC GATATCGAGA TCTCCGCCGC CTTCGACGTT 
GCCGCGTCGA AGGTCGGGCG CGATGTCGCG GAAGCGATCT ACGCCGCTCC CAACAACACG 
TTTCGTTTCG CGAATGCACC GTCGACGGGC GTGGTCGTTC AGCGTGGCAG AACGCTCGAC 
GGTATCGGCC GCTATCTGCG CGAGGAGATC GAAGAATCCG ACGTGCCTGC CGCTGATGTC 
GCGGACGTAC TGCGGCAGAC CGAAACGGAC GTTCTCGTCT CCTATCTTCC CGTCGGTTCC 
GAAGTCGCCA CGCGCTGGTA TGCGGAGCAG GCGCTCGCGG CCGGCTGCGG TTTCGTCAAC 
TGCATTCCCG TTTTCATTGC CTCGGACAAA TCGTGGCAGC GGAAATTTGC CGAGCGCGGG 
CTGCCGCTCA TCGGTGACGA TATAAAGAGC CAGGTCGGTG CGACCATCGT GCACCGGCTG 
CTTGCCAATC TCTTCCGCGA TCGGGGGGTG CGTATCGACA GGACGTACCA GCTCAACTTT 
GGCGGCAATA CCGACTTTCT CAATATGCTC GAGCGGGAAC GGCTCGAATC GAAGAAAATA 
TCCAAGACCC AATCTGTGGT CAGCCAGATG GACATTCCGC TCGCGGCCGG AGACATTCAT 
GTGGGTCCGA GTGATCACGT TCCGTGGCTC GCCGACCGCA AGTTCGCCTA TATTCGCGTC 
GAGGGCACGA CATTCGGCAA CGTTCCCCTC AATGTCGAGC TGAAGCTCGA AGTGTGGGAT 
TCGCCGAACT CGGCGGGTGT CGTGATCGAT GCTGTTCGCT GCGCCAAGCT CGCAATCGAC 
CGCGGCATTG CCGGGCCGCT CATTGCTCCT TCGAGCTATT TCATGAAGTC GCCACCGCAG 
CAATTTACCG ATGCGGAGGC GCGCAGGCGG CTGGAGGAAT TCATCGCAGG CGAGACCGGC 
GCACTCCTGG GGGCGGCCGA GTGA

Protein sequence

MGSKSIRVGL VGIGNCASSL VQGLTFYRDA KEDEPVPGLM HANLGGYHVG DIEISAAFDV 
AASKVGRDVA EAIYAAPNNT FRFANAPSTG VVVQRGRTLD GIGRYLREEI EESDVPAADV 
ADVLRQTETD VLVSYLPVGS EVATRWYAEQ ALAAGCGFVN CIPVFIASDK SWQRKFAERG 
LPLIGDDIKS QVGATIVHRL LANLFRDRGV RIDRTYQLNF GGNTDFLNML ERERLESKKI 
SKTQSVVSQM DIPLAAGDIH VGPSDHVPWL ADRKFAYIRV EGTTFGNVPL NVELKLEVWD 
SPNSAGVVID AVRCAKLAID RGIAGPLIAP SSYFMKSPPQ QFTDAEARRR LEEFIAGETG 
ALLGAAE