Gene Smed_5896 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5896
Symbol
ID	5320198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	861207
End bp	862232
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	61%
IMG OID	640777591
Product	sulfate ABC transporter, periplasmic sulfate-binding protein
Protein accession	YP_001314523
Protein GI	150377928
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.183484
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.734335
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAGCGC GTGTATTTGT CGGGATCATG TTCGGCGTGA TTTCGGTCGG AGCCCTGCAA 
GTCGGCTTTC TCGGTGCCGC TGTCGCCGGC ACGACGATCG TGAACGTTTC CTATGACTCG 
ACGCGAAAAC TCTACAAGGA GTTCAATGCT GCGTTCGCTG AAAAATGGGA GACGGAGACC 
GGCGAGAAGG TGACGATCGA CATGTCGCAC GGCGGTTCGG GCAAGCAAGC GCGATTGGTG 
ATCGATGGCC TCGAAGCGGA TGTGGTGACA CTGGCGCTCG AAGGCGATAT CGATGCCATT 
GCTCAGGCGA CCGGCAAGCT TCCCCCGGAT TGGAGAACAC GCCTCGAGAA CAATAGTGCG 
CCCTACACAT CGACGGTCGT TTTCCTGGTT CGCAAGGGCA ATCCGAGAGG CATCCGGGAT 
TGGGGCGATC TGACGAAGGA GGGCATCCAG GTCGTCACGC CGAACCCGAA GACCTCGGGT 
GGCGCGCGCT GGAACTTCCT TGCAGCCTGG GCCTGGGCGC GGGATGCAAA CAACGGCGAC 
GAGGCCAAGG CGCAGGAATA TGCGGCGGCG CTTTTCAAGC AGGTTCTCGT TCTCGACACC 
GGCGCGTGGG GAGCGATGAC CACTTTCGTC CATCGCGGGC TCGGCGACGT GCTGCTCGCC 
TGGGAGAATG AGGCCTATCT CGCGCTCGAT GAACTCGGCC CCGACAAGTT CGAGATCGTG 
ACACCGTCCA TATCGATCAG GGCCGAGCCC TCCGTGGCGC TCTTGGACGG GAATGTCGAC 
AGCAAAGGCA CCCGCAATGT TGCCGAAGCC TATCTCGGCT ACCTCTACAG CGACGTCGGC 
CAGAAGATCG TCGCCAAGCA CTACTATCGG CCGTTCAAGC CCGAGCTGGC CGACCCCGCG 
GACTCGGCAC GCTTTGCCGA TCTCAAACTG GTCACCATTG GCGACTTCGG CGGTTGGCAG 
GAAGCCCAGC CGAAGTTCTT CGACGATGGG GGGATTTTCG ACCAGATCTA TAAGCCGGGC 
CGATAG

Protein sequence

MGARVFVGIM FGVISVGALQ VGFLGAAVAG TTIVNVSYDS TRKLYKEFNA AFAEKWETET 
GEKVTIDMSH GGSGKQARLV IDGLEADVVT LALEGDIDAI AQATGKLPPD WRTRLENNSA 
PYTSTVVFLV RKGNPRGIRD WGDLTKEGIQ VVTPNPKTSG GARWNFLAAW AWARDANNGD 
EAKAQEYAAA LFKQVLVLDT GAWGAMTTFV HRGLGDVLLA WENEAYLALD ELGPDKFEIV 
TPSISIRAEP SVALLDGNVD SKGTRNVAEA YLGYLYSDVG QKIVAKHYYR PFKPELADPA 
DSARFADLKL VTIGDFGGWQ EAQPKFFDDG GIFDQIYKPG R