Gene Smed_3564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3564
Symbol
ID	5324452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	3770980
End bp	3772110
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	64%
IMG OID	640792513
Product	oxidoreductase domain-containing protein
Protein accession	YP_001329214
Protein GI	150398747
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0520703
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGCA GGCGCAGGCT GGGCATCGGC CTGATCGGCA CGGGCTTCAT GGGCAAGGCC 
CATGCTCTCG GCTTCACGAT TGCAGCGCGG GTCTTCGACC TGCCTTTCGA GCTGGACCTC 
GTATCCGTCG CGGACGTGAC TGTGGAGGGC GCGGAGGCGG CCAGGGGACG GCTCGGCTTC 
CGCAAGGCGA CCACCGACTG GCGCGACCTT CTGATCGACC CGGAGATCGA CGTCATCGAT 
ATCACCACGC CGAACCTCCT GCACAAGGAG ATGGCGCTCG CCGCGATTGC CCATGGTAAG 
CACGTCTATT GCGAAAAGCC GCTGGCCCCG ACGGTCGCCG ACTGCGCCGA GATGGTTGCG 
GCGGCCGAAA AGGCAGGGGT CGTCACCCAG CTCGGCTTCA ACTATCTCAA GAACCCGCTC 
ATTTTTCTCG CCAGGGACAT CATCGAAAGC GGCGAGATCG GCGAGATACG GTCGTTTCGC 
GGCGTTCACG CGGAGGACTT CATGGCGGAT CGGACCGTTC CCTGGGGCTG GCGGCTCGAT 
CCGCGCAGCG GCGGCGGGGC TCTTGCCGAC ATCGGCAGCC ATATGATCGC CTGCATGCGC 
CATCTCGTCG GGCCCGTTAG GTCCGTGCTG GCCGACTCCG TAATCCACGT TGCGGAACGC 
CCGCTCGCTC GCGGCGCAAC AGAGACCCGC GCCGTCGAAG TCGACGACGT AACGCGGGCT 
TTTGTTCGAT TCGAGAGCGG CGCAAGCGGG AGCTTCGAAG CCAACTGGAT CGCGACCGGC 
CGCAAGATGC AGCACGACTT CGAAATTTAC GGGTCAAAAG GCAGCATCGT CTTCACGCAG 
GAACGGCTGA ACGAAATCAA GATCTATTAT GCGGGCGACG ATATAAGGAG CCGCGGCTTC 
CGCACCATCT GGGCGGGTCC GGAACATCCG CCCTACGGGG CGTTCTGCGT CGCTCCGGGC 
CACCAGATCG GCTTCAACGA TCTGAAGGCG ATCGAGGTCC ACGAATTCCT GGAAGCGATC 
GCGAATGGCG TCAGGACGTC TACCGATTTC CGCGAGGGTT ATGAGGTCCA GAAGGTCCTC 
TCCGCGACCT ACCACTCCGC CCGGACGAAC GCCTGGGTGG AGATCGGGTG A

Protein sequence

MSGRRRLGIG LIGTGFMGKA HALGFTIAAR VFDLPFELDL VSVADVTVEG AEAARGRLGF 
RKATTDWRDL LIDPEIDVID ITTPNLLHKE MALAAIAHGK HVYCEKPLAP TVADCAEMVA 
AAEKAGVVTQ LGFNYLKNPL IFLARDIIES GEIGEIRSFR GVHAEDFMAD RTVPWGWRLD 
PRSGGGALAD IGSHMIACMR HLVGPVRSVL ADSVIHVAER PLARGATETR AVEVDDVTRA 
FVRFESGASG SFEANWIATG RKMQHDFEIY GSKGSIVFTQ ERLNEIKIYY AGDDIRSRGF 
RTIWAGPEHP PYGAFCVAPG HQIGFNDLKA IEVHEFLEAI ANGVRTSTDF REGYEVQKVL 
SATYHSARTN AWVEIG