Gene Smed_0198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0198
Symbol
ID	5321028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	225195
End bp	226382
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	62%
IMG OID	640789131
Product	polysaccharide export protein
Protein accession	YP_001325892
Protein GI	150395425
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAACGAG TGACTGCCCT TCTGCTCTGT ACCGCGCTTG CGGGATGCCA GGCCGTACCG 
GGCGAGGGCC CTTTGACAAC CGATATCGTG TCGGATGCCG GCCAGTCCGG ATCCGAGATC 
GGCAGAAGGA ATGCCACGGT TTTTGATATC GTCGATGTCG ACGGGCAGTC GGCGCGGCTT 
GTTTCCGAGT ATGTTTCCAC AACCCTCAGC CGCCGCTTCG GGATTGGCGG TGGCGTCGGC 
CAAGTAGTCA TCGGCATCGG TGACCAGTTG AAGGTCACGA TCTTCGAGGC GGGCAGCGAC 
GGCCTGTTTT CCACAACTGA ATCGAAGCAG ACGAGCATCG ACCTCGTCGT CCAGCCCGAT 
GGCAAGGCCG CGATTCCCTA TGTTGGATCT GTCCGCTTTG CCGGTCTGAC GCTCGAGCAG 
GCGCGGCAGG CGATCCTGGA GGCGCTGAAG CAGAAGGCGG TGGAACCGGA TGTGATCGTG 
ACGTCGACAT CGACGGCATC GCGCAACGTG ACTGTCTCCG GCGCGGTCGG CCGCCCCTCG 
GTCGTGCCGC TCAATCTCGT CAGCGAGACG ATCAATGAGG TGATCGCCAA GGCGGGCGGC 
CCCTCGGCGC AGCCTTACGA GACCTACGTC ACCCTCGTGC GCGGCAAGAA GACCGGCACG 
GTCCTGCTGA AGTCGATGAT TGAAAGCCCT TCGGAAAACA TTCACGTAAA GCCCGGCGAC 
CAGATCTTCG TTACGCGCGA TCCGCGCACC TTCACGGTCC TCGGCCAGGT CCGGGCCAAT 
CAGCGCGTCG AGTTCGGCGC CAACGACCTC AACCTGCTCG AAGCCGTGGC GCTCGGAGGC 
GGCGGCTCGG ATCGCACGGT GGACGCCAAG GGCTACTTCG TCTTCCGGTT CGAGGAGCCG 
GACATCGTCA TGAGCCTGCT TGGGCAGGAG CGTTTCCATC AGATGCTGAG CAAGGGCATG 
AAAGCCGATC GCGTGGGGCG CTATCCCATC GTCTACCGGT TCGACATGAC CAACCCGGAC 
AGTCTCATCG TCGGCCAGAC CTTCCCGATC AAGAATCGCG ACGTCATCTA CGCCTCGCGC 
CATCCCTCGG TCGATATCAC GAAATTCCTC GACTTCGTCG CACGTCCGAT CGGTATCGTG 
AATTCCGGCG TAAACATCGC CGACAATATC GACGACTTCA GAAACTGA

Protein sequence

MKRVTALLLC TALAGCQAVP GEGPLTTDIV SDAGQSGSEI GRRNATVFDI VDVDGQSARL 
VSEYVSTTLS RRFGIGGGVG QVVIGIGDQL KVTIFEAGSD GLFSTTESKQ TSIDLVVQPD 
GKAAIPYVGS VRFAGLTLEQ ARQAILEALK QKAVEPDVIV TSTSTASRNV TVSGAVGRPS 
VVPLNLVSET INEVIAKAGG PSAQPYETYV TLVRGKKTGT VLLKSMIESP SENIHVKPGD 
QIFVTRDPRT FTVLGQVRAN QRVEFGANDL NLLEAVALGG GGSDRTVDAK GYFVFRFEEP 
DIVMSLLGQE RFHQMLSKGM KADRVGRYPI VYRFDMTNPD SLIVGQTFPI KNRDVIYASR 
HPSVDITKFL DFVARPIGIV NSGVNIADNI DDFRN