Gene Sare_4025 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4025
Symbol
ID	5706429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4576389
End bp	4577939
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	73%
IMG OID	641273450
Product	diguanylate cyclase
Protein accession	YP_001538806
Protein GI	159039553
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000068225
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGGGTTGGC TGGACCGCGT CGGCGACCAG GTCGACACCC TGACACAGGC ACGCGGCCTG 
CAGGAGTCGA GCCGCTCCGC CGAGGCGTAC CGGATCCTCA CTGGCGTACT CACCACCACC 
ACCGACCGGT ACGCGCGTGC CGACGCCCTG GTGCAACGCC TCTCGGCGTT GCTCAACCTG 
GGCCGCACCG CGGAATACAC CCGGGCCATC GAGGAGGCCA CCACCGCGGT CCGAGACATC 
GCCGAGCCGT ACCCGCACGG CCACCTCCAC GCGCTCGCCG CCCTCGCCGC CCACCACCAG 
GGTGCGCTGG ACCGCTGCGT CATGCATCTG GTACGGGCCG CTCGTGCGCT GGGGGCCGTC 
GAGGATACCG ACCGAGACAC CGCGTGGGGC TGGCACGACC TCGCAATGGC CTACTCCTAC 
CTCAGCTTTC ACGGGTACGC GCTGGGCGCG ATCGAGCGAG CACGGCAGCT CGGGCTCGCC 
GCCGGCATCC CGGAGGAGAC CTTCGCCGCC CCCGGCATCC GGCTACGCAA CGCCGTCGCG 
CTGGACCACA CCGGCGACAG CGACGGCTGC CTGCGGGTGC TCCGCGACGT GGCCGGGGAC 
CTGGGGCAGT TCCTGCGCGC CGGACGGGCC AGCCGACTGC GCCCGAGCAG CCTCGCCGCG 
TACGGTTACG CCGCCGCGCG GCAGGCCGCC CTGGGCGACC GGTTGGCGGT GGGAACAGAC 
GGTGCCCCGG CTCGACTGCT GAGCCACGGC GCCGACAGTG CCCGAGCTCG GGACATGCGC 
CAACTCGGCG AGGTCTGCCT GGCCATCGCG GACGACCGTC CGATCGAGGC GGTCACCCGG 
CTGGACACCG TACGGGTGTC CACCGAGACG CTGGGCGCGG CCGAGCCCGC CCGGCTACGC 
AGCATCGCGC TGAGCCGGGC CGGGGAGCAC GCCGCCGCGC ACCGGGCCGA CCGGCGGGCG 
TTCCGGCTCG CCGCGCAGCG CAACGATCGG CTCCGGGACG TCTACATCGA CGGGATCGCC 
GCCCGGATCG ACCACGAGGA GATGCGTCGC GAGGCAGCCC GCTTCGAGGG CGAGGCACTC 
ACCGATCCGC TGACCGGGCT ACCCAACCGG CGCCGGTTGG AGCGACACAT CGCCGCCGTG 
ATGGCCCAGG GCGAACGGGT GGTGATCGGC GTGTGCGACC TGGACGGTTT CAAGGCGGTG 
AACACACACC ACGGGCACCA CTCCGGTGAC CTGGTGCTGC AACGGGTCGC CGGCGTGGTC 
AACCGGATGA TGCGGCGAAA CGACTTCGTG GCCCGCTACG GCGGCGACGA GTTCGTCGTG 
GTGCTGCTCG GCACCGGCAT CGACGAGGCG GACGAGGTGG CACGCCGGAT CGAGTCCGCC 
ATTCGGACCG AGGACTGGGA ATCCCTCGTA CCCGGCACCC CCGTCGGAGT CAGCATCGGC 
TTCGCCGAGG TGGCTGCCAC CGGGCCCGAC GTTCAGGACG CCCTGAGCAC CGCCTTCGAG 
GTCGCCGACC GGGAGATGCT CCGCGCGAAG ACCCGTCCCC GCGCGTCCTG A

Protein sequence

MGWLDRVGDQ VDTLTQARGL QESSRSAEAY RILTGVLTTT TDRYARADAL VQRLSALLNL 
GRTAEYTRAI EEATTAVRDI AEPYPHGHLH ALAALAAHHQ GALDRCVMHL VRAARALGAV 
EDTDRDTAWG WHDLAMAYSY LSFHGYALGA IERARQLGLA AGIPEETFAA PGIRLRNAVA 
LDHTGDSDGC LRVLRDVAGD LGQFLRAGRA SRLRPSSLAA YGYAAARQAA LGDRLAVGTD 
GAPARLLSHG ADSARARDMR QLGEVCLAIA DDRPIEAVTR LDTVRVSTET LGAAEPARLR 
SIALSRAGEH AAAHRADRRA FRLAAQRNDR LRDVYIDGIA ARIDHEEMRR EAARFEGEAL 
TDPLTGLPNR RRLERHIAAV MAQGERVVIG VCDLDGFKAV NTHHGHHSGD LVLQRVAGVV 
NRMMRRNDFV ARYGGDEFVV VLLGTGIDEA DEVARRIESA IRTEDWESLV PGTPVGVSIG 
FAEVAATGPD VQDALSTAFE VADREMLRAK TRPRAS