Gene Smed_0193 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0193
Symbol
ID	5321023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	211898
End bp	213220
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	63%
IMG OID	640789126
Product	capsule polysaccharide biosynthesis protein
Protein accession	YP_001325887
Protein GI	150395420
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3562] Capsule polysaccharide export protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCAG ACAAGATGAA CAACCCTGCG ACGCCAAGGA CCTTCCTGTT CCTTCAGGGT 
CCGTCGTCGC CGATCTTCGC CAAGATTGCC GGGCATCTCG AGGCCTTGGG CAACACCTGT 
CTTCGCATCA ATCTCAATGT CGGCGACCGG ATATTCTGGC GCCGCCGGGG CGGCCAGGAT 
TATCGTGGCT CGCTTGCCGA ATGGCCGGCT TTCGTGGAGA CCTTCATCCG CCGCCACTCC 
GTCACCGATC TTGTGCTGCT TGGCGAAGAG CGCCCCTATC ATCGCACTGC CACAGCCGCC 
GCGCGAAACG CCGGCATTCG CGTCTTCGTC GTCGAGATGG GATATCTCAG GCCCGACTGG 
CTGACCCTCG AGCGCGGCGG CATGTCGTCA AACTCGCATT TTCCGACGGA CCCCGTGCAA 
ATCCTGCGTG CATCGGCAGG ACTGCCCGAG CCGGACTGGA AGCGGCGTTA CCGTCAGACC 
TTTATTGCCG AAGCTGCTTA CGACCTCCTC TACAATCTGC CGAACGTCTT TCTCTGTTTC 
CTCTTTCCCG GCTATCGCCG TCACGCGATC TTCCACCCGC TTGCCGAATA TGCCGGCTGG 
ATCCGGCGGC TGGCGACCGG CAGGGCTGAA CGGCGGAAGT CGGATGCACT GATCCGATCA 
CTGGCCGGTG CAGGTGCGCC ATACTTCGTC TACCCGCTTC AGCTCGAAAC GGACTACCAG 
TTGCGTGCGC ATTCACCTTT CAGCAGTCAG CGGGAAGCGA TCGACGCCAT CCTTGCCTCT 
TTCGCGCGGC ATGCGCCCGC TGGAACCAGG CTGGCCATCA AGCTACACCC GCTCGACAAC 
GGCCTGATCC CCTGGCGCAA GATCACTGCA GGCATCGCCG CCTCGCTCGG CATCTGGGAG 
AGGGTTTTCT TTCTCGATGG AGGCAATCTC GACCTTCTCA TGCAGAACAG TTCCGGCATG 
GTAACGGTCA ACTCGACCGC CGGACTGCAT GCCCTGAAGC AGGGCAAGCC CGTGAAGATC 
CTGGGCACGG CGGTCTTCGA CATCGCCGGC CTGACGGATC AGCAGCCACT CGACCTTTTC 
TGGGAGGCAC CACAGGCACC GGACCCCGCC CTGGCCACGG CAACGTTCAG GTTGATGGCC 
GCTTCGATCC AGGTGCGCGG CAACTTCTAT TCCCGTGCAG GAACGGACGC CGGCGCCAAG 
GCGATCGCCG AGCGCCTGCA TCGCAACGAT GTCAATGAGC CCGGTGCCTT CGTCGATCCC 
CCGCCCCGGC AAAAGCCGGT GAAGATGAAG GATCAGGCGA CGCCGGCGCG CAGCAGATCG 
TGA

Protein sequence

MTADKMNNPA TPRTFLFLQG PSSPIFAKIA GHLEALGNTC LRINLNVGDR IFWRRRGGQD 
YRGSLAEWPA FVETFIRRHS VTDLVLLGEE RPYHRTATAA ARNAGIRVFV VEMGYLRPDW 
LTLERGGMSS NSHFPTDPVQ ILRASAGLPE PDWKRRYRQT FIAEAAYDLL YNLPNVFLCF 
LFPGYRRHAI FHPLAEYAGW IRRLATGRAE RRKSDALIRS LAGAGAPYFV YPLQLETDYQ 
LRAHSPFSSQ REAIDAILAS FARHAPAGTR LAIKLHPLDN GLIPWRKITA GIAASLGIWE 
RVFFLDGGNL DLLMQNSSGM VTVNSTAGLH ALKQGKPVKI LGTAVFDIAG LTDQQPLDLF 
WEAPQAPDPA LATATFRLMA ASIQVRGNFY SRAGTDAGAK AIAERLHRND VNEPGAFVDP 
PPRQKPVKMK DQATPARSRS