Gene Smed_4718 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4718
Symbol
ID	5318898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1240917
End bp	1242095
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	60%
IMG OID	640776516
Product	polysaccharide pyruvyl transferase
Protein accession	YP_001313448
Protein GI	150376852
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.440204
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.00516951
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGTCCAC GGATCCTCGT GACGGGAATT CCTGGTCACT ACACGCGCCT CGCCAACGGC 
GCGCAGGGAT TATCCGTCTC CTATTCGGAG CGGCAGAAAC AGCCCGAAAC GAAGGAGGAG 
TTCCTGCAGG AGCTTCGCAA TATCAGCAAT ACCGGCAATT ATCTGATCGG CGAGGGGGCA 
CTGCGGGCGA TTGCCCCGCA TGCGAAGCAG GTGCCGTTTT GGCACCTTTA CAATTGCAGC 
CAGAACGGCG TCGGCCTCGA GGAGTTCAAT GCCAATTTCG ACATCTGCGT GTTCACCTGC 
GCGAACCTTT TGCGAAAGGG CCTGTCAGCG GATGCCGAGG CGGAAGTGCT GGGCAAGCTC 
AAAATGCCGA TCGTCATGCT CGGCATCGGG CTGCAGAACC GGCGGGACCT GGAAAACAGC 
CTTCCGGAAG GCACGAAGCG GCTTCTCGAC GTTCTTAAGG AGCGCGAGCA CTATTTCCTG 
ACGCGTGGCT TCGAGACGGC AGGCTTCCTC AAGGATCAGG GTTTCTCCTA CGTCCAGCCG 
ACCGGATGCC CTTCCATCTA TCTGATGCCG CACAATATGC GCGCCTCCCT GAAGAAGCTG 
CCAAAGGTAC CGGTGGGCAA GGCGCGGACG ATCTTTTCCG GTTATCTAGG TGCCAATCAC 
GACTGCATCG TCGATGCCGC GGCACTGGCG CCGGAGGGTT CGCGTCCCCA ATACGTTATT 
CAGGACGAAT TCCTTCACTT CGACATGAAC GTGGAAGCGA ACGGCGATGG ACGGGTGTAC 
GATTCCGCCT CGGGAGTGAT GCTCGGTGAG CTGAGTTATC CGGGCACGGA ACGGCTGAAG 
ACGCCCTTCG ACGTCCGTAC CTTCTTCGAC ACGAACCAGT GGCGCGCCTG GGCTTCTTCC 
ATGGATTTCA ATTTCGGCCG ACGCTTCCAC GGCTCGATTA TCGCCATGCA GGCAGCCGTG 
CCTAGCCTGA TGGTGGCAGT AGATGACCGG ATGCGCGAGA TGCTCGGCTA TACCGGGCTG 
CCGGCGATCG ACGCCGTCGA GGTCGACAAG GCGGATAACC GGGCTGAATT CGTCGCCGAC 
CACCTGGCCG GACTGAACGC ATCCGAACTG GTCGACAGAT ATTCCGATCG CGAGCGCACG 
TTCCGCTCGG CGCTCAGAGA GATCGGAATA GGTCAATAG

Protein sequence

MRPRILVTGI PGHYTRLANG AQGLSVSYSE RQKQPETKEE FLQELRNISN TGNYLIGEGA 
LRAIAPHAKQ VPFWHLYNCS QNGVGLEEFN ANFDICVFTC ANLLRKGLSA DAEAEVLGKL 
KMPIVMLGIG LQNRRDLENS LPEGTKRLLD VLKEREHYFL TRGFETAGFL KDQGFSYVQP 
TGCPSIYLMP HNMRASLKKL PKVPVGKART IFSGYLGANH DCIVDAAALA PEGSRPQYVI 
QDEFLHFDMN VEANGDGRVY DSASGVMLGE LSYPGTERLK TPFDVRTFFD TNQWRAWASS 
MDFNFGRRFH GSIIAMQAAV PSLMVAVDDR MREMLGYTGL PAIDAVEVDK ADNRAEFVAD 
HLAGLNASEL VDRYSDRERT FRSALREIGI GQ