Gene Smed_4681 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4681
Symbol
ID	5319323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1196098
End bp	1197135
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	64%
IMG OID	640776479
Product	glycosyl transferase family protein
Protein accession	YP_001313411
Protein GI	150376815
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.627848
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.36467
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCCAG AACCGCTCGC AATGATGCAA GACGATCCGA TAGCACCGGA TGCTCGGCGC 
TTGGTCGCCG CCTCGCCTTC CGGTGAGCCC GGGCCGTTCG CCAGCTTCAT CGTCTGCACG 
CACAACCGCG TCCACGCGCT TGCGGCGTCG ATCCGGTCCA TCGAGACCGC CAGCCGCGCT 
CATGCCATGG TCGAGAGCGA ACTCGTGGTG GTAGACAATG GCTCGACGGA CGGCACGGCG 
GAAGAACTGG CCGGCATCGC GGCAAGAACG ATGATGTCGA TCACGCTCCT CACCGAGCCT 
CGCCCGGGTC TCGCCGCAGC GCGCAACACG GGGATGGCAC GCGCGCGCGG ACGGATACTC 
ATCTTCATCG ATGACGATTG CGAGGTGGAC AGCAATTACC TCCGTGATCT CGAGCGGCAC 
TACAGCGGTG GTGATGAACA AGTCATCCGC GGCGGGCGCG TCGAGCTCGG TAATCCCGCC 
GATCTACCGT TCACCGTCAA GCGCTCGAAG GTGGCGGCGC GCCTGACCCG CGATGTCCAC 
CCGGGCGGAT TCGTCCTTGG CTGCAACATG ACCATGCATC GTGACATTGC GGCGCGCATC 
GGCCCTTTCG ACGAGCGGTT CGGTGCCGGA GCGCCGCTGA AAGCCGCCGA GGATACGGAC 
TACCTGGTGC GGGCTTTTGA GCTGGGCATA CCGGTTGAAT ACGTGCCTGA CATGGTCGTC 
CATCACCACC ACGGCCGCCG CCATCGTGCG GCAATCGAAG AGCTCCATCG CAACTACAGC 
CTCGGCAATG GCGGGCTTTG TCTGAAGCAC CTCCTTCGCG CGCCGTGGCT CCTCAAGCAT 
TTCGGCTGGA CCGTCAGATC CGCGTGGGGC GAGGCTTTCG GCCGTTCCCG CTTCGATCCA 
GAACTCCAAT TGTCACACTG GCCCATCGTT TCGATGAACC TGCTTGGCGC ACTTCGCTTT 
GCGTGGCTTG CCGCGGCGAA TGCGGAACCG CGGATCGAAC GGCGACGGGT CGAACAACCA 
GAGCCGAAGC TCAGGTGA

Protein sequence

MAPEPLAMMQ DDPIAPDARR LVAASPSGEP GPFASFIVCT HNRVHALAAS IRSIETASRA 
HAMVESELVV VDNGSTDGTA EELAGIAART MMSITLLTEP RPGLAAARNT GMARARGRIL 
IFIDDDCEVD SNYLRDLERH YSGGDEQVIR GGRVELGNPA DLPFTVKRSK VAARLTRDVH 
PGGFVLGCNM TMHRDIAARI GPFDERFGAG APLKAAEDTD YLVRAFELGI PVEYVPDMVV 
HHHHGRRHRA AIEELHRNYS LGNGGLCLKH LLRAPWLLKH FGWTVRSAWG EAFGRSRFDP 
ELQLSHWPIV SMNLLGALRF AWLAAANAEP RIERRRVEQP EPKLR