Gene Smed_0194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0194
Symbol
ID	5321024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	213236
End bp	214828
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	60%
IMG OID	640789127
Product	sulfatase
Protein accession	YP_001325888
Protein GI	150395421
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1368] Phosphoglycerol transferase and related proteins, alkaline phosphatase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCGCTCA TTCCCTTCCA ACTGCATGAC TACCCCTTAG CCTTGACCCT TGGCTGCTAT 
CTGCTGGCCT GCGCGGTGAT CTTCCATACG GACCGTTTCG CTCTGCCGGC GCGCGAACGC 
CGGAAGAACG CACCTCGATA TGGTCGCCAT CACGACAGGA TAGACCGCCT CGCCCGGCTG 
CCGGTCATCG CACTCGTTTT CGCCGGCTTT TTCGCTATTT CGTGGAGGCC GCTCTATGCC 
GCTGCCGGAA CGATGAGTTT CTTCATCATC TTCACCGGCA TTTCCCGCGC CAAGTACAAG 
TTCATCCGCG AGCCATTGGT CTTTTCCGAC ATCGCCCTGG TCGCGGACGT ATTCAAATAC 
AAGTCCATCT TCTATGCGAC CTCACTGAAC GTCGTCTTCT GGATCGTCGC CTTCCTGTAC 
GTGTTTGGCG TGTCGGGGCT CTATATGTAT TTCGAGCCTG CTATCCTGCC CGAGAGAAAC 
CGGCTCTTCT GGGTTCTCGT CTTGATCGGA ATTGCCGCCG GGCCCTGGGC CCTGCTGTTC 
TACGGACCGG TCAACCGCCC GACAGCCGCT CTCGTGCAGA GGCTTGTGAA GGCGATCAAC 
GTCAAGATCA ACACGGTGCG TTTCGGCACC TTCGCTTCCG TCGTCTTCCA CTTCATCATC 
TGGCTCGGCG TCAAGCGCGA CAAGATCGTC GCCGAATTGT CGGGAATGCT GCGCGCCGCA 
GTACACGACC TCATCGGTCA CGAGGAAGCC CCGCTCATCG TAGTATGGCA ATCGGAGTCC 
TTCATCGACA TGCGGCACTT CGGCGTCGAT TCCATCAAGC TTCCGACGAT CGACCGGCTG 
CGCAAGCAGG CGGTGCAATG GGGCCGATTG AGCAATGTCT TCGAAGGCGG ATATACGCTG 
CGGACCGAGT TTGCGGTCCT CAGCGGCCTC GTTCCCGACG ATATTCACGT CGACGCAAGC 
TATCCCTATC TCCGCGCCGC GCACTATGCC GACGTCGTCT GGCCGGGAAA GCTGAAGCGT 
GCCGGTTGGC GCACGCATTT CATCCACCCC TACGACCGGA CATTCTTCCT GAGGCATAAG 
GCAATGCCCC TTCTCGGATT CGAGAAGCTG ACCATGCTCG ATGCCTTCGA CCACAATCCG 
GAGCGTGACG GACTCTATGT CTCCGACGCG ACGCTGGCGG CGCGCGTGCT GAGCGAGGTC 
CAGAAGCTGC CGGAAGAGGA AAGCGGTTTC TTCTTCGTCG CATCAATGGC CAACCACGGC 
CCCTGGGAGC CAGGACGTGT CGGAACGCTC ACCAACCCGG TCGACATCTA TCTGGCAATT 
CTCGAGCAGT CGGACGCCGC GCTGAAGCAG TTGGTCGACG GCCTCAACAA GCTCGACCGG 
CCGGTCTGGC TCGTCTTCTA TGGCGACCAT GCGCCCCTTC TGAAGTCTTT CGCGGACCCC 
TTCCCGGATC CCCGCTCGGA TTATTTCATC GTGCCGCTCG CCAAGGCGCG CGCTTCGGCC 
CATAGCTCGA AGCAAGCGAA AGACGAGGAT CCCTGGAACC TGCTCGGGTC CATGCTGAAG 
CACGCCAATC TGCACAAGGA CGCGCTGCAA TAG

Protein sequence

MALIPFQLHD YPLALTLGCY LLACAVIFHT DRFALPARER RKNAPRYGRH HDRIDRLARL 
PVIALVFAGF FAISWRPLYA AAGTMSFFII FTGISRAKYK FIREPLVFSD IALVADVFKY 
KSIFYATSLN VVFWIVAFLY VFGVSGLYMY FEPAILPERN RLFWVLVLIG IAAGPWALLF 
YGPVNRPTAA LVQRLVKAIN VKINTVRFGT FASVVFHFII WLGVKRDKIV AELSGMLRAA 
VHDLIGHEEA PLIVVWQSES FIDMRHFGVD SIKLPTIDRL RKQAVQWGRL SNVFEGGYTL 
RTEFAVLSGL VPDDIHVDAS YPYLRAAHYA DVVWPGKLKR AGWRTHFIHP YDRTFFLRHK 
AMPLLGFEKL TMLDAFDHNP ERDGLYVSDA TLAARVLSEV QKLPEEESGF FFVASMANHG 
PWEPGRVGTL TNPVDIYLAI LEQSDAALKQ LVDGLNKLDR PVWLVFYGDH APLLKSFADP 
FPDPRSDYFI VPLAKARASA HSSKQAKDED PWNLLGSMLK HANLHKDALQ