Gene Sare_3937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3937
Symbol
ID	5703674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4480149
End bp	4481339
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	73%
IMG OID	641273362
Product	putative signal transduction histidine kinase
Protein accession	YP_001538718
Protein GI	159039465
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.24552
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0307354
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGCCG TTGCCCCCAC GACCGCACTA CCCGGCCTAC CCGAGCCCAA GGGGCCGCCG 
GAGGCGGCCA CTCCTGCGGG CGACGCCTTC ACCCTCATCT TCACCACCAC TCCGGCCCTG 
CTCCGACTGA CCGTCGGGCT GGTCGGCGCC GTGGTGGCGG TGTCGGTCCG GACGCCGCCC 
GTGGTGCCCC CGCTACTGTT CCCCGCCACC GTGATACTGG CCTCGTGGTC GGTCTGGTAC 
GCACGTCGGG CGCTCCGACG TGGCTTCACC ACGCCGCTGG TATCCGGTGA CGTCGCTCTG 
ACCTCCGCAG CCTGTCTGGC CACTCCCGTG CTGGTCGCCC CGGAGGTGTT GCCCGGTGAG 
GTCAGCTGGA TCGCGGTGTT GGCCAGCACC ACCGTGATCA ACGCCCAGGC GACCGCGCCG 
GCCCGCTGGT CGATCCCGGC CGGCGTGCTG GTCACCGCCG CCTACGCCGT CGGCTCGCAC 
ACCGCCGGCA ACCCACGAGA GGCCGTCGCG CATACGGCCA CCCTGCTCGT CCAGACCGGC 
ATCGCTGCGG CGATAACCGC GGTGATGCGT CGTCGGATCA CGCGCGCCGA CCACGCCTTC 
GCCAAGGACC AGCGGCTGGC CCGCCAGCAC CTGATCGCCC GCACCGCGCG GGATGCCGAA 
CGCCGGCAGA ACCGGAACCT GCACGACACC GTGCTGGCGA CACTGACCGT GGTCGGGCTG 
GGGGCGGGAG CCGGTCCAGC GCTGCGGGAG AGGTGCTCCG CCGACCTGTC CACCCTCTCC 
GCGCTGGTGG ACCGCCCCCC GGCGAACGGC CCGGTCGCCT TGGACACACG GCTACGGACG 
GTACTTTCCC GACTGCCGGG CCTGGCGGTC ACCGCGGACC TGGCACCCTG CACCGTGCCC 
GTGGCAGTGG CCGAGGCGGT AGCGGAGAGC GTCGCTGCCG CGCTGTCCAA CGTGGCCCGG 
CATGCCCCGA CCGCGGCGAC CGTGCTGCGT CTCACCCGGG CCGGCGGCGC CGTCGTGGTG 
GAGGTCGTCG ACGACGGTCC CGGTTTCGAG CCGGCCACGG TACCGACCCA TCGGTACGGG 
ATTCGCGAGT CGATCTGCGG ACGGATGGTC AGCGTGGGCG GGCGGGCCCA GGTCCACTCC 
CGGCCCGGCG CTGGCACTCG GATCCGGCTG GAGTGGTCGG ATGTCTGCTG A

Protein sequence

MPAVAPTTAL PGLPEPKGPP EAATPAGDAF TLIFTTTPAL LRLTVGLVGA VVAVSVRTPP 
VVPPLLFPAT VILASWSVWY ARRALRRGFT TPLVSGDVAL TSAACLATPV LVAPEVLPGE 
VSWIAVLAST TVINAQATAP ARWSIPAGVL VTAAYAVGSH TAGNPREAVA HTATLLVQTG 
IAAAITAVMR RRITRADHAF AKDQRLARQH LIARTARDAE RRQNRNLHDT VLATLTVVGL 
GAGAGPALRE RCSADLSTLS ALVDRPPANG PVALDTRLRT VLSRLPGLAV TADLAPCTVP 
VAVAEAVAES VAAALSNVAR HAPTAATVLR LTRAGGAVVV EVVDDGPGFE PATVPTHRYG 
IRESICGRMV SVGGRAQVHS RPGAGTRIRL EWSDVC