Gene Smed_0533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0533
Symbol
ID	5321367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	573936
End bp	576848
Gene Length	2913 bp
Protein Length	970 aa
Translation table	11
GC content	62%
IMG OID	640789467
Product	diguanylate cyclase/phosphodiesterase with PAS/PAC sensor(s)
Protein accession	YP_001326224
Protein GI	150395757
COG category	[T] Signal transduction mechanisms
COG ID	[COG5001] Predicted signal transduction protein containing a membrane domain, an EAL and a GGDEF domain
TIGRFAM ID	[TIGR00229] PAS domain S-box [TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.935916
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCTGC CACGTAAGCC GCACGCTTGG CCAGCCACAT GGTTGACGGC GATTCTGGTC 
GCACTCGTCG TTTTCGCCCT TGGCTTTGGC GGCGGCGTTG CGCATGCGCT CGAGCCGGTG 
AAGATCTCGC GCGAAGACAC GGCGCTCGAC CTTACCGCAA CGACGGAGAT CTATAGCGGC 
CGGGGCGACG CATTCCAGGT TTCGACCGCC CCGGGCACTG ACGGCATCGT CCGGCGCATC 
GAAGTGCGTT CCAGCACCGA GAGCCATCAG GGAGACTGGG CCGTATTCGC GCTCGCCAAC 
GTTTCGGAAG AGCAGCTCGA ACGCGTGATC GTGGCGCCGC ATTTCCGCCT CGTGAATTCG 
AAGCTCTTCT GGCCCGACCT CGGGTCGCAG CGCATTCTTT CGATCACGCC GAGCGAGGGT 
TTCGCGCTTG ACCGGCAACC GAGCGAAGAG GCGGACGTCT TCCGCATCAC GCTCAATCCG 
GGCGCGGTGA TCACCTTCGT TGCCGAACTC ACGACGCCGG AGCTGCCGCA GATCTATCTT 
TGGCAACCGG ACGCCTACAA GGACACCGTC AACGCTTTCA CGCTTTATCG CGGTATCGTG 
CTCGGGATCG CCGGCCTGCT GGCGGTTTTC CTGACAATCC TGTTCGTCGT CAAGGGCACG 
TCGATGCTGC CGGCGACGGC AGCTCTCGCC TGGGCAGTGC TCGCCTATAT CTGTGTCGAT 
TTCGGCTTCC TTTCGAAGCT CATCACCGTG ACTGCGGATG ACGAGCGCAT ATGGCGTGCA 
GGAACGGAAG TGTTTCTTGC GGCCGGGCTC GTCGTCTTTC TTTTCACCTA TCTCAATCTC 
AATCGCTGGC ATCAGCATCT CGGTTATGCG ACGCTTGCCT GGATTCTCGG CCTCGGGCTG 
CTCTTTGGCG TTGCCGTCTA CGATCCGGCA ATCGCCTCCG GCATCGCCCG CCTGTCCTTC 
GCGCTGACGG CCACCGTCGG GATCCTGCTG ATCGCCTATC TCGGCTTCAA CCGCTACGAC 
CGTGCGATTC TCCTTGTTCC CGCCTGGCTG CTGATCCTCG TCTGGCTGTT CGGCGCCTGG 
CTTGCCGTAA CCGGCCAGCT TGCCAACGAC ATCGTGCAAC CGGCGCTCGG CGGCGGGCTC 
GTTCTGATCG TCCTATTGAT CGGCTTCACG GTCATGCAGC ACGCCTTTGC CGGCGGAGCC 
TATCAGCAGG GTCTGTTCTC CGATCTTGAA CGTCAGGCGC TGGCGCTCAC CGGCTCGGGG 
GACACGGTCT GGGATTGGGA CGTGGCACGC GACCGTGTGG TCACCATTCC CGATATCTCG 
CACCAGCTCG GGCTTTCGCT GGGGACGATG AACGGGCCGG TACGCAACTG GTTGCCACGG 
TTGCACCCGG ATGACCGCGA TCGTTTCCGG GCAACGCTTG ACGTGCTGCT CGAACATCGC 
CGCGGCCGGC TCAACCATGA GTTCCGCGTT CGCGCCGAGG ACGGCCATTA TCATTGGCTC 
TCCATCCGGG CGCGCCCGGT GCTCGGGGCC AACGGCGAAA TCATCCGTTG CGTCGGCACC 
ATCATCGACA TTACCGAACA GCGCAATTCC GTCGAGCGGC TCTTGCACAA CGCGCTTCTG 
GACAATCTGA CGGGTCTGCC TAACAGGCAG GTCTTCCTCG ACCGGCTGCA GGCTATCCTT 
CTTATGGGCG ACGGCAGCAG CCCGATACGG CCGACCGTGC TTGCCATCGA CATCGACCGT 
TACAAACAGG TCAACGACAT GTTGGGAATT GCGGCCGGCG ACAATATCCT CATCGCGCTC 
ACGCGTCGGC TGCGTCGCCT TCTACGTCCG CAGGACACGC TCGCGCGTCT CGGCGGCGAC 
CAGTTCGGAC TGATCCTCAT GTCCGAGCGC GATCCGGCCA AAATCGCCGA CTTCGCCGAT 
GCGATCAGCA AGGCAATCAT GGTTCCGCTC AATTACGGCA ATCGTGAGAT CAACCTGACC 
GCTTCGATCG GCCTGGTCGC CTGGCTCGAT CAGGAACAGA GCGCTGCCGG ACTGCTCGAC 
GATGCCGAGC TTGCGATGTT CCGCGCCAAG AAGGCAGGCG GCAACCGCGT CGAGCCGTTC 
AGGCCGGCTT TCCGGACCTC CGGCTCCGAC CGTCTGCAGC TCGAAACAGA CTTGAAGCGC 
GCCATGGAGC GCAAGGAGCT TTCCCTCGTT TACCAACCGA TCGTCCGACT CAGCGACGCC 
GAGATCGCCG GCTTCGAGGC ACTCATGCGT TGGGAACATC CCAAGCGCGG CAATATTTCG 
CCGACCGAAT TCATCCCAAT TGCCGAAAAT TCCGAGCTGA TAAGCCACCT CGGCCTGTTC 
GCCTTCGACA AGGCAACAAG CGATCTCGCC GAATGGCAGA CTCAGACCGG TGACCTGCCG 
ATCTTCGTCT CCATCAATCT GTCGAGCGCA CAGCTTCTGA ACAACGAGCT CTATGACGAC 
ATGCGTGCGA TTCTCAGCAA GAGCCGCTGC GACCCGTCCC AGATCAAGAT GGAGCTGACG 
GAATCGCTTG TCATGGAAAA CCCCGAACAG GCCAGGCTTG TGCTCGAAAA GCTTCGGGAA 
GCCGGGCTGC GGCTGGCCCT CGACGACTTC GGCACCGGCC ACTCGTCGCT CTCCTATCTC 
ACCCGCTTCC CATTCGACAC GATCAAGATC GACAAGGCGC TGGTCCGCGA TCCAAGCGAC 
AAGCGCGCCG TCATCCTGCG TTCGGTGATC ACGATGGCGC GCGAGCTCGA CATGCGGGTG 
GTCGCGGAGG GGATCGAATC CGAAGAGGAT GCGATCCAGC TCGCGCAGAT GGGTTGCGAT 
TACGGTCAGA GTTTCCTGTT CGGTCCGCCG GTCGGATCGG AATCTATTCT CAGGCTCTTG 
AAGGAGCGGT TTCCTCTGAT GAAGCGGGCT TAA

Protein sequence

MPLPRKPHAW PATWLTAILV ALVVFALGFG GGVAHALEPV KISREDTALD LTATTEIYSG 
RGDAFQVSTA PGTDGIVRRI EVRSSTESHQ GDWAVFALAN VSEEQLERVI VAPHFRLVNS 
KLFWPDLGSQ RILSITPSEG FALDRQPSEE ADVFRITLNP GAVITFVAEL TTPELPQIYL 
WQPDAYKDTV NAFTLYRGIV LGIAGLLAVF LTILFVVKGT SMLPATAALA WAVLAYICVD 
FGFLSKLITV TADDERIWRA GTEVFLAAGL VVFLFTYLNL NRWHQHLGYA TLAWILGLGL 
LFGVAVYDPA IASGIARLSF ALTATVGILL IAYLGFNRYD RAILLVPAWL LILVWLFGAW 
LAVTGQLAND IVQPALGGGL VLIVLLIGFT VMQHAFAGGA YQQGLFSDLE RQALALTGSG 
DTVWDWDVAR DRVVTIPDIS HQLGLSLGTM NGPVRNWLPR LHPDDRDRFR ATLDVLLEHR 
RGRLNHEFRV RAEDGHYHWL SIRARPVLGA NGEIIRCVGT IIDITEQRNS VERLLHNALL 
DNLTGLPNRQ VFLDRLQAIL LMGDGSSPIR PTVLAIDIDR YKQVNDMLGI AAGDNILIAL 
TRRLRRLLRP QDTLARLGGD QFGLILMSER DPAKIADFAD AISKAIMVPL NYGNREINLT 
ASIGLVAWLD QEQSAAGLLD DAELAMFRAK KAGGNRVEPF RPAFRTSGSD RLQLETDLKR 
AMERKELSLV YQPIVRLSDA EIAGFEALMR WEHPKRGNIS PTEFIPIAEN SELISHLGLF 
AFDKATSDLA EWQTQTGDLP IFVSINLSSA QLLNNELYDD MRAILSKSRC DPSQIKMELT 
ESLVMENPEQ ARLVLEKLRE AGLRLALDDF GTGHSSLSYL TRFPFDTIKI DKALVRDPSD 
KRAVILRSVI TMARELDMRV VAEGIESEED AIQLAQMGCD YGQSFLFGPP VGSESILRLL 
KERFPLMKRA