Gene Sare_1643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1643
Symbol
ID	5705906
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1883945
End bp	1885555
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	68%
IMG OID	641271151
Product	adenylate/guanylate cyclase
Protein accession	YP_001536526
Protein GI	159037273
COG category	[T] Signal transduction mechanisms
COG ID	[COG2114] Adenylate cyclase, family 3 (some proteins contain HAMP domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.292421
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCTGC CGCTTTTGGG GTTGTGGCTG CTGGTGGCGC GTCCGCAGGC CGATGTGCAC 
TGGCATGATC CGTTGGGTCA TTTCTATTTG ATCGTTGCGG TGGCGCTGGT GAACCTGGTG 
ATCGGCGTCA TGGTCAGTGC GGCGGCGCAT CGGCGGCATG ATGCGCGACT GTTCCTGGTG 
TCGTTGGCGT TTGTGGCCAG TGCCGGGTTC TTCGTGTTGC ACGGGTTGGC CACGCCGCAG 
GTGCTGGTGG AGCATCCGAA TCTCGGGTTC GAGTTGGCGC AGCCGGTGGG GCTGGCTTTC 
GCCGCCGTGT TCGCGGTGGC CTCGTCGCTG CCGTTGGACG GCCGGCGGGG CGCGGCGATC 
CTCCGCGCGC GGCATATCTT CTGGGGTGAG CTGGCGGTGA TCCTCGCCCT GTGGGGCGTG 
GTGTCGTTGC TGGATATGCC GCCGTTGTCG GATCAGCCGG ACCCGGCGGT GGAGGACGCG 
TGGCTGGTCT GGCTGGCGCC GGTGTCGGTG GCGTTGCTGT TGGTCGCCGC GGTGCGGTAC 
TTCCTGCTGT ATCGGCGTCA GCCGTCGGCG ATGTTGATCA GTGTGATCAC GGCGTTCGTG 
TTGCTGGCTG AGGCGATGGT GACGGTGGTG CTGGCCGACA AGTGGGCGTT GTCGTGGTGG 
CAGTGGCATG TGCTGCTGGC GTTGGCGTTC GGTTTTGTCG GCTACAGCGC GTTTGTTCAG 
TACCGTCGTG AGGGTTCGTC TGCCGGGCTG TTCGACGGGT TGGCGTTGGA TCAGACCATC 
AGGGCGGTTC GGGCCGAGTA CAGTGCGGCG TTGGAGGAAC TGGTGTCCGC GCTCGCGGAG 
CGGGAGCGTG ACGGTACCGG TGACATCGGC CCGGTCGCGG CCGGGTTGGG GGAACGGTTC 
GGGCTGACCG AGCGGCAGAC CGCGGTGCTG GAACGCGCCG CACAGGCGTT GTCGGCGGAG 
CGGGAGGTCA GCCGCCGGCT GGGTACCCTC TTTCGGCACT ACCTGTCGCC GGATGTCGCG 
GCCGCGTTGA TCGCCGACCC GGACCAGGCG GCGTTGGGTG GCTCGGTTGT CGAGGTGACG 
GCCCTGTTCG CCGACCTGCG CGGGTTCACC ACGTTCTCTG AGGCGGCCGA ACCCGCGGAG 
ATCGTGGCCA TGCTCAACCG CTACCACGGG GTAGCGGTTC CCTGCATCCT CGACAACGGC 
GGCACCGTGG TGCAGTTCGT CGGTGACGCC TTACTGGCCC TGTTCAACGC CCCAGCCCGG 
CAGCCCGACC ATGCGCTACG CGCGGTACGC GCGGCCACCC AGATGCGCCA CGCCGTGGAC 
GAGATCGCCG CCGGCCACCC CGACTGGCCG CGGTTCCGGA TCGGGGTGAA CACCGGCCCG 
GCGCTGGTCG GGAACATCGG CAGCGACCAG CTACGCGGCT TCAACGCGAT GGGTGACGCG 
GTCAACGTGG CCGCCCGACT GCAAACGATG GCCGACCCCG GCCAGATCGT CATCGGCGAA 
TCCACGTGGC GATCCACCCA CACCCAGGTC CCGGTCGAGC CACTCGGGGA CCTCACCGTC 
AAAGGGCGAA CCGGTCTGGT CCGAGCCTAC GCGGTACAGG TGCAGCAGTG A

Protein sequence

MALPLLGLWL LVARPQADVH WHDPLGHFYL IVAVALVNLV IGVMVSAAAH RRHDARLFLV 
SLAFVASAGF FVLHGLATPQ VLVEHPNLGF ELAQPVGLAF AAVFAVASSL PLDGRRGAAI 
LRARHIFWGE LAVILALWGV VSLLDMPPLS DQPDPAVEDA WLVWLAPVSV ALLLVAAVRY 
FLLYRRQPSA MLISVITAFV LLAEAMVTVV LADKWALSWW QWHVLLALAF GFVGYSAFVQ 
YRREGSSAGL FDGLALDQTI RAVRAEYSAA LEELVSALAE RERDGTGDIG PVAAGLGERF 
GLTERQTAVL ERAAQALSAE REVSRRLGTL FRHYLSPDVA AALIADPDQA ALGGSVVEVT 
ALFADLRGFT TFSEAAEPAE IVAMLNRYHG VAVPCILDNG GTVVQFVGDA LLALFNAPAR 
QPDHALRAVR AATQMRHAVD EIAAGHPDWP RFRIGVNTGP ALVGNIGSDQ LRGFNAMGDA 
VNVAARLQTM ADPGQIVIGE STWRSTHTQV PVEPLGDLTV KGRTGLVRAY AVQVQQ