Gene Smed_4999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4999
Symbol
ID	5318720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1514089
End bp	1515114
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	51%
IMG OID	640776781
Product	capsule polysaccharide biosynthesis protein
Protein accession	YP_001313713
Protein GI	150377117
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3563] Capsule polysaccharide export protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.851528
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0115997
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACAG CATTTGTCTT TGGGCTAAGC CCTTGGAAGG ACTTCATTAG AAGCTGGCTT 
CCCGAAGAAA GGATATATTG CCAAAAGCGG ACAATTTCCT GGCTGGAATT TCACGCGGTC 
TGGGCACCGT TGATATTAGT ATCAAAGGAT CCGAAAATAT ACGTATGGGG CTACAAGCAC 
CCTCCCTTCA TCGAAAGGTT CTCAAGGCTA AGTCGCGTTA ATCTCATCCG AATAGAAGAC 
GGATTCATTC GCTCAGTTGC TTTGGGCGCC AGCAAGGCGC CACCACTTTC TCTTTGCTTC 
GATTCTCCTG TCCTTTACTA CGATCCCAGC TCACAGTCGA CACTTGAACG CCTCATAGAG 
ACCTACCACT TTTCGGCGGA CCCAGCTCTG CTGTTGCGAG CACGAACGGG AATGAACCGC 
TTGGTCAGCA GCCGGTTGAG CAAGTACAAC ACGTCCCAAG ACGTTGATGT CCACCGTATC 
TACGGCCCGA AAGACTGCAA GCGAATACTG GTTCTCGGTC AAGTAGAGGA TGACATGTCG 
ATCATCAAGG GCTGTTCGCG CCTGATGACT AACAACGACC TCGTCCGTCT CGCCGTTCAA 
GAGAATCCCG GTGCACAAGT AATCTACAAG CCCCATCCGG AAGTATTACA CGGCACCAGA 
CTCGCCCGAT CGAGTCCGGA AGAGGTTAGA CCAATCGCGC AGGTTCTCGA TGACGACATT 
GCTTTGGCGG ATGCCTTCGA AACAATCGAT CACGTTTATA CGATCACCTC ACTCTCGGGA 
TTCGAAGCGC TGATAAGAGG AATAAAGGTA ACTTGCCTTG GCATGCCGTT CTATGCGGGT 
TGGGGACTTA CTGATGATCG CCAATCCTGC TTGCGCCGCT CGGCGAAGCG TAGCGTGGAA 
GAGGTGTTCG CTGCAGCCTA TCTACTCTAT CCCAAATATT TCCATCCGCA TGAGAAGAAG 
ATGATTTCAT TTGAAGAGGC GCTGGAACTT CTCCATTCCA TGAAACACGC TTCGGCTACT 
CCCTAA

Protein sequence

MTTAFVFGLS PWKDFIRSWL PEERIYCQKR TISWLEFHAV WAPLILVSKD PKIYVWGYKH 
PPFIERFSRL SRVNLIRIED GFIRSVALGA SKAPPLSLCF DSPVLYYDPS SQSTLERLIE 
TYHFSADPAL LLRARTGMNR LVSSRLSKYN TSQDVDVHRI YGPKDCKRIL VLGQVEDDMS 
IIKGCSRLMT NNDLVRLAVQ ENPGAQVIYK PHPEVLHGTR LARSSPEEVR PIAQVLDDDI 
ALADAFETID HVYTITSLSG FEALIRGIKV TCLGMPFYAG WGLTDDRQSC LRRSAKRSVE 
EVFAAAYLLY PKYFHPHEKK MISFEEALEL LHSMKHASAT P