Gene Smed_4803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4803
Symbol
ID	5318690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1322312
End bp	1323628
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	61%
IMG OID	640776597
Product	glycosyl transferase group 1
Protein accession	YP_001313529
Protein GI	150376933
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.70984
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGGGA GGTCGTCTTT GCAGCGCGAG ATCTTTTCGA TGAGCGCAAC AATGAAAGAG 
GGCTTTGCCC TTTGCGGCGC GGCCGCTTCG GTCTTCCGTG AAATACCGCG GCAGTTTGGT 
CGCCGCACCC GCCAGATCAG CCACATTGTG GCGACGACTG GGTTTCAGGG GGTCATCTGC 
CGCGCCAGAT TCAAGGCATC GGACTGGATA AGACCTCGCG AGCCGGTCTG GCCAGTTGTT 
CCCGATGACA TTATCGCCGC CGACCTCTCA CAGCCCTTCT GCGCACGGGT TCCGGAGATC 
GATCGGGAGG CCCCGATAAC GGTGAACTGG GTAACGGGGC CGGCCGGACG CGGATCGGGC 
GGACACACGA CACTGTACAG GATCGTCAAG CAACTCCAGA ATAGCGGCTA TTTGAACCGC 
GTCTACCTGT ACGATCCGTA CGCAGGGGAT CCCAAGTACT ATCAGGGGCT CGCACGTGAG 
CATTATGGGC TCACCTGCGA GATAGGCGAC ATCCGCGACG GCATGAAGGA TGCCGACGCA 
CTGGTAGCGA CGAGTTGGCC AACGGCATAC GCCGTCTTCA ATGCGCGCTG CGCCGGCAAG 
CGGTTCTATT TCGTTCAGGA CTACGAACCA TACTTCTATC CGGTGGGCAC AAACAGTGTG 
CTTGCCGAAA ACACCTATCG AATGGGCTTC CATGGCATCA CCGCTGGGCG CTGGTTGGCT 
GAAAAGCTCG CCCGGGAGTT CGGCATGCAG AGCGACTATT TCCCGTTCGG TTGCGATACG 
GCCCTGTATC GCCGGGACCC CGCCTCGAAG CGGTCCGGGG TCGCTTTTTA CGCGCGGGTC 
GGTACCCCGC GTCGCGCCGT CGAGCTGGGC CTTCTGGCAC TCGAGTTGTT CGCAAAACGG 
CAACCCCAGA TCGAATTGCA CCTGTTCGGC GAGCGGTTCG ACAATCTGCC GTTCCGCGTC 
ACCAATCATG GGCTCGTATC CCCCCAAAGG CTCAACGAGA TCTACAATCG CTGTTTTGCC 
GGCCTGAGCC TCTCGCTGAC GAATGTCTCG CTCGTGCCGC AGGAGATGCT CGCGTCCGGC 
TGTCTCCCCG TCGTCAACGA CGCGGTGCAA AATCGAATTG TCCTCGATAA CTCGTACGTG 
CGGTACGCTC CACTGACGCC CCATCTGCTT GCGGCCGCAT TGGAGAGCGT GGTGAGCATG 
CCTGACTTTG CAAGCGTATC GAAGAAGGCA TCCGAGAGCG TTGCGCCAAC GTCCTGGAAC 
ATGGCGGGGG CGGCGGTAGA CAGGGCATTT CGCGTGGCGC TCCGGCAGGC TCTTTGA

Protein sequence

MGGRSSLQRE IFSMSATMKE GFALCGAAAS VFREIPRQFG RRTRQISHIV ATTGFQGVIC 
RARFKASDWI RPREPVWPVV PDDIIAADLS QPFCARVPEI DREAPITVNW VTGPAGRGSG 
GHTTLYRIVK QLQNSGYLNR VYLYDPYAGD PKYYQGLARE HYGLTCEIGD IRDGMKDADA 
LVATSWPTAY AVFNARCAGK RFYFVQDYEP YFYPVGTNSV LAENTYRMGF HGITAGRWLA 
EKLAREFGMQ SDYFPFGCDT ALYRRDPASK RSGVAFYARV GTPRRAVELG LLALELFAKR 
QPQIELHLFG ERFDNLPFRV TNHGLVSPQR LNEIYNRCFA GLSLSLTNVS LVPQEMLASG 
CLPVVNDAVQ NRIVLDNSYV RYAPLTPHLL AAALESVVSM PDFASVSKKA SESVAPTSWN 
MAGAAVDRAF RVALRQAL