Gene Smed_3831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3831
Symbol
ID	5318539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	285619
End bp	287550
Gene Length	1932 bp
Protein Length	643 aa
Translation table	11
GC content	64%
IMG OID	640775643
Product	adenylyl cyclase class-3/4/guanylyl cyclase
Protein accession	YP_001312576
Protein GI	150375980
COG category	[S] Function unknown [T] Signal transduction mechanisms
COG ID	[COG2114] Adenylate cyclase, family 3 (some proteins contain HAMP domain) [COG5616] Predicted integral membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACGCA AACTCGCAGC AATCGTAGCA GGCGACATCG TCGGCTATAC CCGGCTGATG 
TCCGAGGACG AGTCCTCGAC CTATTCCGCA TTGCGGGAGG TTTTCAGCGC GCTGATCACA 
CCTGCGGTCG AGAAGCACGG CGGCCGAACA TTCAAGACCA CGGGCGATGG TTTTCTCGCG 
ACGTTTCCGA GCGTCAACGA GGCCCTTGAC GCCGCAATCG AGATCCAGAA CGGATTTGCG 
GATCGGCCCT TCGACATGCG CCTCGGCATC AATCTCGGTG ACGTCATTGA AGTCGATGGC 
GACATGTTCG GCGACGGCGT GAATGTCGCG TCGCGGCTAG AAGCCATGGC CGAGCCCGGC 
GGCATTTTTG TGAGCGAAGC CGTGGTTCGC AGCGCTGACC GGAACCGAAG CAAGCTCTTC 
TACAGCATCG GGCGAAGGCA GGCGAAGAAC ATTCCCGAGC CGCTCGCCGT CTATGCCGTG 
CGGCTTGGGG CGGATGAGGA AAGCCCCAGC GGCTGGTTTG GACGGACGGC TCGCGGGCGC 
CGCGCCGCCT TGCCCTATGC TATCGGAGCC GCAGCATTTG TCCTTATCGC CGCTGCCACC 
CAGGCGCCTG CGGTGAGAGC GATCGGCGCG GACATGGTCG ATAGCTTCGG ACGTCTGACC 
GGTGCGGAGC TTGCCGATGC AAGGCCGACG GTCGCGGTTC TGCCGTTCGA TGATATGAGC 
GGCGGCGCCG ATCAGGCCTA TTTCGCCGAT GGGCTTACGG AAGACATAAT CGCCAATCTC 
GCGAGAAATC GCGAGCTTCA GGTGATCGCC CGCAATTCCA CCTTCGCCCT TCGCGGCCAG 
GCCGAGGACA TTCGCCGGAT CGGCGAAAGG CTTGGCGCCG GCTATGTGGT GGAAGGCAGT 
GCCCGGCGCG CCGGAGACCA GCTCCGCGTC GTGGCGCAGT TGATCGATGC GCGCAGCGGT 
GCGCATCTGT GGTCGCGCAG TTACGACCGC CGGGTCGAGG ACATTTTCTC GGTCCAGACC 
GAGCTGACGG CCGAGATCGT GTCGCATCTC GTTTCCTATG TGCGCGAGTC GGAAGTATCG 
AACGCGGCGG AACAGCCCAC CGAGAACCTT CAAGCCTACG ATCTCGTCCT GCAGGCGCGT 
AACCGTTACA AGCATGGTTC GAAAGACGCC GAGGCGCTGA TCGCTTCTCG TGCGTTGCTT 
CATAGGGCAC TCGAACTCGA TCCTGGCTAT GCCGCAGCGC GCGCCAGTCT CGGAATGACC 
TACATCGTAG ACTTCGTGCA GAACCTCACC GGCCGGGCGA CCGTGACCGA TGTGGAAACA 
GGGCTTAGCG AGTCGCGGCA GGCCGTCCGC CTCGATCCGA ACCTCGCAGT CGGGTACCAG 
GTGCTCAGCT TCGGCCTCTC GGCCACCGGG GACTATCCCG GCGCCATGCA GGCGGCACAA 
CGCGCGGTCG AGCTCAATCC CAACGATCCG GACAGCCTCA TGGCACTGGC CAAGGCGCAG 
GTCAGATTCG GCAGCTATGA CGAGGCTGTG CAAAACGCCG AGCGGGCCCG GCGGCTGCAT 
CCGATGGCGC CGGAATACTA TACCTATGTG TACGGCCAGG CGCTTTATGC TGCCGGCCGC 
CTCGATGAAG CCGATGAGGT CTTGCGCGAA TGCCTGATCC GGGCGCCGCG CGAACCGGAT 
TGCCTGCTGA TCCAGACGGC CGTCCTGAGC CAGCGTGGAG ACGCCCAGGG GGCGCAGCGC 
ACCATGGCGC GGCTGACCGA AGCAGATCCC GAATTTTCCC TGGCCAGCGA GCGCGCCCTG 
CGCCGGTTCG GCGACACCGC GCTCATGGAG CAATTCCTGT CGCAGCTTTC CGAGGCAAAC 
GCTCCGGACG TTACCAGTGG CTTCGTTCAG CCGCCCCCTC AAGCACGCAT TCAGACGGCC 
AACAGTCTGT AA

Protein sequence

MERKLAAIVA GDIVGYTRLM SEDESSTYSA LREVFSALIT PAVEKHGGRT FKTTGDGFLA 
TFPSVNEALD AAIEIQNGFA DRPFDMRLGI NLGDVIEVDG DMFGDGVNVA SRLEAMAEPG 
GIFVSEAVVR SADRNRSKLF YSIGRRQAKN IPEPLAVYAV RLGADEESPS GWFGRTARGR 
RAALPYAIGA AAFVLIAAAT QAPAVRAIGA DMVDSFGRLT GAELADARPT VAVLPFDDMS 
GGADQAYFAD GLTEDIIANL ARNRELQVIA RNSTFALRGQ AEDIRRIGER LGAGYVVEGS 
ARRAGDQLRV VAQLIDARSG AHLWSRSYDR RVEDIFSVQT ELTAEIVSHL VSYVRESEVS 
NAAEQPTENL QAYDLVLQAR NRYKHGSKDA EALIASRALL HRALELDPGY AAARASLGMT 
YIVDFVQNLT GRATVTDVET GLSESRQAVR LDPNLAVGYQ VLSFGLSATG DYPGAMQAAQ 
RAVELNPNDP DSLMALAKAQ VRFGSYDEAV QNAERARRLH PMAPEYYTYV YGQALYAAGR 
LDEADEVLRE CLIRAPREPD CLLIQTAVLS QRGDAQGAQR TMARLTEADP EFSLASERAL 
RRFGDTALME QFLSQLSEAN APDVTSGFVQ PPPQARIQTA NSL