Gene Sare_4857 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4857
Symbol
ID	5707596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5512596
End bp	5513921
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	73%
IMG OID	641274253
Product	histidine kinase
Protein accession	YP_001539598
Protein GI	159040345
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0991376
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGTGGG CGCTCAACCG GCTGGCGCTG GCCATCACGT CGATGGTGGC ACTGGCCTTC 
CTCGTGCCGC TCGCGGTGGT GACCCGCCAG CTGGCGCACG ACAGGGCCAT CGGTGATGCC 
CGCCAGCAGG CTGCCGCGAT GGTGGCGGCG CTCGCCGTGG ACGAGGATCC GCACCTGCTG 
ACGCGCGCGG TGATGAGCAC CACCGCCGGC AGCGAGGGAC GGCTCGCCGT GCACCTGCCC 
GACGTGGCCC CGGTCGGGGT GGTGCACGCC ACCGCCACCG ACGTGGCGCT CGCCGCCGGA 
TACCGGCGTC CGGTCACCGC GGACACGAGC GGCGGTCTGG CCTACCTGCT GCCGACGGTG 
ATCAGCGACG GGCAGACCGC GGTGATCGAG GTACACGTGC CCCGCGAGGA TATGGAGCGC 
GGGGTATGGC GTTCCTGGCT GGCCCTCGCG GGCCTCGCCG TCATCCTGGT CGGTGGCTCC 
ACACTCGTTG CCGATCGACT GGGTAGCCGG ATCGTGCGGT CCACCCGCCG GCTCGCCGGT 
GCCGCCCGGC AACTCGGCAC CGGCGACCTG ACCGCCCGGG TCGCCCCCGA CGGCCCGGCG 
GAGTTGCACG ACGCCGCACA GGCGTTCAAC GGGCTCGCCC AGGACATGCG GCGGCTGATC 
GACGCCGAGC GGGAGATAGC CGCCGACCTG TCGCACCGCC TGCGTACGCC GCTGACGGCA 
CTGCGCCTCG ACGTCGAGGC CATGCCGCCC GGGCCCGTCG GGGAGCGGAT GCGGCAAGCC 
TGCGACCTCC TCGACGAGGA GTTGGAGGCC ATCATCACGG GGGCGCGGAG CAGCGTGGGC 
GAGCGCGACA CCGAGTGCAC CGACCTCGTC GAGGTGCTGG CCGACCGGCT GGCGTTCTGG 
GCTGTCCTGG CCGAGGACCA GCAGCGGCCC TGGACGGTGG TCGGCGGCGA TCGGCAGGTG 
CCGCTGCCGG TGCCACGCGG TGATCTGATC CTGGCGGTGG ACGCCCTGCT CGGCAACGTG 
TTCGCGCACA CCCCGGAGGG GTCGGCGTTC CAGGTCACCG TCTCACCGGA CGCGCTCGTC 
GTCGACGATG CCGGTCCCGG CATCGCCGAC CCCGCCGCAG CCGTCCGACG CGGCACGAGC 
GGAGCCGGTT CGACCGGGCT TGGCCTGGAC ATCGTGCAGC GAATAGCCAT CGCCGCTGGC 
GGTCGGCTGC ACATCGGCAC CGGGTCGTTG GGTGGCGCCC GGGTGGCACT GGTCCTGGCG 
GCGGGCACAG CATCCGACCT GCCGTCTGTG CCGAACGAGC GCCGTTGGCA CGCCGACCGC 
AGCTGA

Protein sequence

MRWALNRLAL AITSMVALAF LVPLAVVTRQ LAHDRAIGDA RQQAAAMVAA LAVDEDPHLL 
TRAVMSTTAG SEGRLAVHLP DVAPVGVVHA TATDVALAAG YRRPVTADTS GGLAYLLPTV 
ISDGQTAVIE VHVPREDMER GVWRSWLALA GLAVILVGGS TLVADRLGSR IVRSTRRLAG 
AARQLGTGDL TARVAPDGPA ELHDAAQAFN GLAQDMRRLI DAEREIAADL SHRLRTPLTA 
LRLDVEAMPP GPVGERMRQA CDLLDEELEA IITGARSSVG ERDTECTDLV EVLADRLAFW 
AVLAEDQQRP WTVVGGDRQV PLPVPRGDLI LAVDALLGNV FAHTPEGSAF QVTVSPDALV 
VDDAGPGIAD PAAAVRRGTS GAGSTGLGLD IVQRIAIAAG GRLHIGTGSL GGARVALVLA 
AGTASDLPSV PNERRWHADR S