Gene Smed_1013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1013
Symbol
ID	5321858
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1083324
End bp	1084265
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	61%
IMG OID	640789955
Product	putative sulfite oxidase subunit YedY
Protein accession	YP_001326701
Protein GI	150396234
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.300604
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAGCA CGCGCGTCCC GAAGATCGCC GCTACGGACA TCACACCGGA ACGCTTCTTC 
CTCAATCGGC GCTCCTTTAT CGCGGCCGCG GCTGGCAGCC TTGCGCTCGG CCCACCCGGA 
GCGAGCCGCG CGGCAGCATT GGAAGCTTCC GCAAGCAAAT TCACGCTTGA CGAAGCCTTA 
ACGCCGGAAA AGGATGCGAC CACCTACAAC AATTTCTATG AATTCGGGAC AGGAAAAGGC 
GACCCGGCGG CCAACTCGGC AAACTTCAAG CCGGCTCCGT GGACGATGAA AATCGACGGT 
CTGGTCGGCA AGCCGCGGGA ATTCGGTCTG GAAGAACTTC TGGCCTTCCC TCTCGAGGAG 
CGCATCTACC GAATGCGCTG CGTCGAGGCG TGGTCGATGG TAATCCCCTG GGTTGGTTTC 
CCGCTGGCCG CGCTCCTCGA CAAGGTAGAG CCCCTCGGGA GCGCAAAATA TGTCGCCTTC 
GAAACTGTTG TCCGGCCCGA GGAGATGCCG GGTCAATCCG GCTATTTCCA GCCGCTTGAG 
TGGCCCTATC GTGAGGGCCT GAGGCTCGAC GAAGCGCGTC ACCCGCTGAC GATCCTCTCC 
GTCGGCCTCT ATGGCAAGAC GTTGCCCAAT CAGAACGGCG CCCCCATCCG CCTAGTGGTG 
CCATGGAAGT ACGGCTTCAA GGGGATCAAA TCGATCGTTC GCATTTCGCT GACCGAAACG 
CCGCCACCCT GCACCTGGAA CCTCGCCGGA CCGAACGAAT ACGGTTTCTA TGCCAATGTA 
AACCCGGACG TCGATCATCC CCGCTGGAGC CAGGCAACCG AGAACCGTAT CGGAGAAGGC 
GGATTCTTTG GCGCCAACCG CCGGGATACG CTCCCCTTCA ACGGCTATGC AGAGGAGGTC 
GCGAGCCTCT ACGCCGGCAT GGACCTGCGG GCGAATTTCT GA

Protein sequence

MPSTRVPKIA ATDITPERFF LNRRSFIAAA AGSLALGPPG ASRAAALEAS ASKFTLDEAL 
TPEKDATTYN NFYEFGTGKG DPAANSANFK PAPWTMKIDG LVGKPREFGL EELLAFPLEE 
RIYRMRCVEA WSMVIPWVGF PLAALLDKVE PLGSAKYVAF ETVVRPEEMP GQSGYFQPLE 
WPYREGLRLD EARHPLTILS VGLYGKTLPN QNGAPIRLVV PWKYGFKGIK SIVRISLTET 
PPPCTWNLAG PNEYGFYANV NPDVDHPRWS QATENRIGEG GFFGANRRDT LPFNGYAEEV 
ASLYAGMDLR ANF