Gene Sare_5081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_5081
Symbol
ID	5704216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5756871
End bp	5757950
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	68%
IMG OID	641274473
Product	myo-inositol-1-phosphate synthase
Protein accession	YP_001539814
Protein GI	159040561
COG category	[I] Lipid transport and metabolism
COG ID	[COG1260] Myo-inositol-1-phosphate synthase
TIGRFAM ID	[TIGR03450] inositol 1-phosphate synthase, Actinobacterial type

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000546373
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGCTCCG TCCGCGTCGC CATCGTCGGT GTGGGTAACT GCGCCTCGTC CCTCGTGCAG 
GGCGTGGAGT ACTACCGGAA CGCTGACCCG AACGACCGGG TTCCGGGTCT CATGCACGTC 
ACCTTCGGCG ACTACCACGT CTCGGACGTG GAGTTCGTCG CGGCGTTCGA TGTGGACGCC 
AAGAAGGTGG GCATGGACCT CGCCGAGGCG ATCGTCGCCA GCGAGAACAA CACCATCAAG 
CTGTGCGACG TGCCGCCGAC CGGCGTGACC GTTCAGCGCG GTCCGACGTT CGACGGTCTC 
GGCCAGTACT ACCGCGAGAT CATCGAGGAG TCGGACGACG AGCCGGTGGA CGTGGCCCAG 
GCGCTGCGCG CCGCCCGGGT CGACGTGGTC GTGGCCTACC TGCCGGTGGG CTCCGAGGAG 
GCCGGCAAGT TCTACGCCCA GGCCGCGATC GACGCCGGCT GTGCCTTCGT CAACGCCCTC 
CCGGTGTTCA TCGCCTCCGA CCCGGCCTGG GCGAAGAAGT TCGAGGACGC GGGCCTGCCG 
ATCGTCGGCG ACGACATCAA GAGCCAGGTC GGCGCCACCA TCGTGCACCG TGCCCTGGCG 
AAGCTCTTCG AGGACCGCGG TGTCGAGCTG CTGCGCACGT ACCAGCTCAA CTTCGGCGGC 
AACATGGACT TCATGAACAT GCTGGAGCGC ACCCGGCTGG TCTCCAAGAA GATCTCGAAG 
ACCCAGTCGG TGACCTCCCA GGTGCCGCAC GAGATGGTCA AGAGCGACGT GCACATCGGC 
CCCTCGGACC ACGTGCCGTG GCTGGACGAC CGCAAGTGGG CGTACATCCG CCTGGAGGGC 
CGCTCGTTCG GTGACGCCCC GCTGAACGCG GAGCTGAAGC TCGAGGTGTG GGACTCGCCG 
AACTCCGCCG GCGTCATCAT CGACGCGGTC CGAGCCGCGA AGATCGCCCT GGACCGGAAG 
ATCGGCGGCC CGATCCTGTC CGCGTCGTCG TACTTCATGA AGTCCCCGCC GGTGCAGTAC 
GCCGACGCCG ACGCGCACGC CGCCGTCGAG GAGTTCATCG CCGGCGAGAT CACCCGTTGA

Protein sequence

MGSVRVAIVG VGNCASSLVQ GVEYYRNADP NDRVPGLMHV TFGDYHVSDV EFVAAFDVDA 
KKVGMDLAEA IVASENNTIK LCDVPPTGVT VQRGPTFDGL GQYYREIIEE SDDEPVDVAQ 
ALRAARVDVV VAYLPVGSEE AGKFYAQAAI DAGCAFVNAL PVFIASDPAW AKKFEDAGLP 
IVGDDIKSQV GATIVHRALA KLFEDRGVEL LRTYQLNFGG NMDFMNMLER TRLVSKKISK 
TQSVTSQVPH EMVKSDVHIG PSDHVPWLDD RKWAYIRLEG RSFGDAPLNA ELKLEVWDSP 
NSAGVIIDAV RAAKIALDRK IGGPILSASS YFMKSPPVQY ADADAHAAVE EFIAGEITR