Gene Sare_3510 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3510
Symbol
ID	5703319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4049108
End bp	4050787
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	72%
IMG OID	641272937
Product	histidine kinase
Protein accession	YP_001538303
Protein GI	159039050
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.026405
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCGCCT CCACTCGCGT CGTGCCTCGA CCGCATCCCC TCGCCGCCGC GGCGCGCGTG 
GTGATGCTGG CGTTGGTGGC GGTGCTGAGC CTGCTCGCCA CGCACGATCC TGCCCAACTG 
TGGTGGGTCG CGCTGCTGGC GGCGACGGGC CTGCCCGCAC TGCTCGCGCC GGTGTACCAC 
TGGCTCGGGC CGCTGGGCCG AGGCGCCGAG GTGGTGGTGC TGGCTCTCGC CACCAGCCAG 
GTCGCCTCGG TCGCCACCAT TGGCGCGCAG AACGGTGGGT TGGGTGCCTC CGCGGTGCTG 
CCCTACCTGG CCGTCCCGAT CACCGTCACG GCACTGCGCC GACGCTTCCG CGAAGGCGCC 
TGGTTACTGG CGATCACCGG CCTCACCCTG CTGCTGGCCG GCGCGCTGAC CGAGGTCGAC 
GGCCAGCGGC AGCTCACCCA GGTCGGCTAC CTGGCAGTCA GCGCCCAGTG GCTGGTCCTG 
TCCGGTCTTG GGCTCTACGC GGCGCGGACC CTGCACCGGG TGATCCGAGC TCGCAGCGTC 
AGCAAGCCCC AGCCGTACGC GGAGGCAACC CGGCTACTCA CCCAGCTTCG GACGGTGGCC 
CGTCAGCTAC CCGGCGCCAC GCTGGACCCG GGTGGTATCT CCGAGCACCT GCTGGAGGAG 
CTGCGCACCC TGGCCCGAGC GGACCGAGGG GCCGTTCTCT CGGCCAGCGG CGGTGGACGG 
CTGGTGGTGC TGGCCCAGTG CGGAACCGAC CGGGTGGACT GGGAGACGAC GCTGGACGCG 
GACTCGGCGA TCGCTGACGC GTGGGCCAGC CAGCAGCCGC ACACCGCCGC GCACTCTCAG 
GCCCGCTCGC ACGCTGGCGG GGAGGTGTCC GCGCTGATCG TGCCGCTGGT CGCCGGGGTA 
CGTACGGTCG GGCTGGTGGT GCTGGAGGCG GACGTCGCGC ACGCGTACCC GCCCGAGATC 
GTGTCCCGGG TGACCGGGCT GACCTCCCCG GCCGCGCTGC GGCTGGAGGC GGCCCTGCTC 
TTCGACGAGG TGCGGTCACT GGCCACCAAC GAGGAGCGAC AACGACTCGC CCGGGAAATC 
CACGACGGGG TGGCCCAGGA ACTGGTGATG GTCGGCTACG GCATCGACAA CGCGCTGGCC 
ACGGTGCACG ACGACACCGA CGAGACCGCC GAGTCGCTAC GACTGCTACG GCAGGAGGTC 
ACCCGGGTCA TTACCGAGCT GCGACTCAGC CTCTTCGAGC TGCGCAGCGA GGTGGACCGG 
CACGGCGGCC TGGCTGCCGC CATCGCCGAG TACGCGCGCA CGGTCGGCGT CTCCGGCGGC 
CTGCGGGTAC ACCTGTCGTT GGACGAGTCG ACCGCCCGGC TGCCCGCCGC CACCGAAGCC 
GAGCTGCTAC GGATCGCCCA GGAGGCCGTG GCCAACGCCC GCAAGCATGC CGGTGCGTCG 
AACCTCTGGG TCACCTGTGC GGTGGACCCG CCGTACGCGC AGATCGAGGT GTCAGACGAC 
GGGCACGGTA TTGCCGACCA GCGCACTGAC GGACACTACG GTCTTGCAAT CATGGCCGAG 
AGGGCGGAAC GTATCCGAGG CCGACTGGAG ATCCGGCCGC GGCAACCGAG CGGCACGACC 
GTGGCCGTGG TGGTCGGTTC GTCGCCTCGG CGCGATAACG TGCCTGACAG CACCGCATGA

Protein sequence

MPASTRVVPR PHPLAAAARV VMLALVAVLS LLATHDPAQL WWVALLAATG LPALLAPVYH 
WLGPLGRGAE VVVLALATSQ VASVATIGAQ NGGLGASAVL PYLAVPITVT ALRRRFREGA 
WLLAITGLTL LLAGALTEVD GQRQLTQVGY LAVSAQWLVL SGLGLYAART LHRVIRARSV 
SKPQPYAEAT RLLTQLRTVA RQLPGATLDP GGISEHLLEE LRTLARADRG AVLSASGGGR 
LVVLAQCGTD RVDWETTLDA DSAIADAWAS QQPHTAAHSQ ARSHAGGEVS ALIVPLVAGV 
RTVGLVVLEA DVAHAYPPEI VSRVTGLTSP AALRLEAALL FDEVRSLATN EERQRLAREI 
HDGVAQELVM VGYGIDNALA TVHDDTDETA ESLRLLRQEV TRVITELRLS LFELRSEVDR 
HGGLAAAIAE YARTVGVSGG LRVHLSLDES TARLPAATEA ELLRIAQEAV ANARKHAGAS 
NLWVTCAVDP PYAQIEVSDD GHGIADQRTD GHYGLAIMAE RAERIRGRLE IRPRQPSGTT 
VAVVVGSSPR RDNVPDSTA