Gene Sare_1767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1767
Symbol
ID	5705094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2037066
End bp	2038475
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	73%
IMG OID	641271270
Product	histidine kinase
Protein accession	YP_001536645
Protein GI	159037392
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.422503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00341518
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCCGGTG TGTGCACGCT GACGGCGCTC ACGTTCCTGG TACCGCTCTC CGCCAGTCTC 
GGCGACGGCG TCCGCGAGGA GGCGATCGCC GATGCGGCCC GCCGCGGATC CTCGGTCGCC 
GGCGCACTCG CCGTCAGCAC CAGCCCGGAG GTGGTCGAAC GGGCGATCGC GGGCAGCGGC 
GACGGTCCGG CCGATCCACC GATCGTGCAC GGGCTGGCCG ACGTTCCGTC CGGTGGTGGC 
CGAGTCTCGG CAGCCGACCT GGAACAGGCT CGGGCGACGG GAAAGTCGAT GCTTGTCGAC 
GTCGACGGCG GCGTGGCCTG GCTCGACCCC GTGGTGCTGG CCGACCGGAC GGCTGTGGTC 
GAGGTCTTCG TGCCGGACTC GGCACTCGCC ACGGGCACCG GTAAGCGGTG GCTGCTCCTG 
GCTGGTCTGG CGACAGGGTT GGTCGCCGCG GCGGTCCTGC TGGTCGACCG GGTGGCCGTG 
CGCACGGTTA ACGCGGCCCG CGGCCTGGTA CGCGGGGCGC TCGCCCTCGG CGCTGGCGAC 
CTGAACGTCC GGGTGGAGCC GAGCGGTTCA CGGGAGTTGG TCGAGGCCGG GTACGCGTTC 
AACCGGATGG CCGAGCATCT CGTGGCGACC CGCGCCGACG AGCGGGAACT GGTGGCCGAC 
CTGTCGCACC GGCTGCGAAC GCCGCTGACC GCGCTCCGGC TGGACGCCGA GGCGCTGGAC 
CCGGACGACA CCAGCATCGG AACCTTCACC GAGGCGGAGC TGGATCGCCG GCGTGGGATC 
CGGCGGATCC GACAGGCGAT CGCCACCCTG GAGGGCGAGG TCGATCAGTT GATCAAGACC 
ACCCGGAAGG CGGCCACCCA GGAGATCGCG CCGGGCAGCT GCGATGTGAG TGAGGTGGTC 
CGGGAGCGGA TGGTGTTCTG GTCCGCCCTG GCTGGCGATC AGAACCGGCC GCACCAGGTC 
ATCGGGGCAC AGCTACGCAT CCCGGCGCCG GTGCCGCGGG CGGAACTGGC CGCCGCACTG 
GACGCGGTGA TCGGCAACGT GTTCCGGTAC ACGTCCCAGG GAACGGGGTT CGAGGTGGCG 
GTCTCCCGGC GGGACGGGTA TGTGGCCATC CGGATCGACG ACGCCGGACC GGGCGTCGCG 
GACCCGGACC GGGCGCTGCG CCGGGGCACC AGCGACCGCG GCTCGACCGG TCTCGGCCTG 
GACATCGCGA AGCGGGTCGC GTTACAGGCC AACGGTTCGG TCAGCATCGA CCGCGCCCGG 
TTGGGGGGAG CGAGTGTGGT GATGCTGCTG GCCGACCCGG AGGCGGCACC GCGGCAGGTC 
AGCCGGTTCG GCCTGGTGGG CCGGAGGGCC CGGGACGCCC GCGACCAGAA GGGCAGCGTC 
CGACGCTGGT ACCGCCGGGC TGACCGCTGA

Protein sequence

MAGVCTLTAL TFLVPLSASL GDGVREEAIA DAARRGSSVA GALAVSTSPE VVERAIAGSG 
DGPADPPIVH GLADVPSGGG RVSAADLEQA RATGKSMLVD VDGGVAWLDP VVLADRTAVV 
EVFVPDSALA TGTGKRWLLL AGLATGLVAA AVLLVDRVAV RTVNAARGLV RGALALGAGD 
LNVRVEPSGS RELVEAGYAF NRMAEHLVAT RADERELVAD LSHRLRTPLT ALRLDAEALD 
PDDTSIGTFT EAELDRRRGI RRIRQAIATL EGEVDQLIKT TRKAATQEIA PGSCDVSEVV 
RERMVFWSAL AGDQNRPHQV IGAQLRIPAP VPRAELAAAL DAVIGNVFRY TSQGTGFEVA 
VSRRDGYVAI RIDDAGPGVA DPDRALRRGT SDRGSTGLGL DIAKRVALQA NGSVSIDRAR 
LGGASVVMLL ADPEAAPRQV SRFGLVGRRA RDARDQKGSV RRWYRRADR