Gene Sare_1089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1089
Symbol
ID	5704080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1226922
End bp	1227983
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	72%
IMG OID	641270604
Product	histidine kinase
Protein accession	YP_001535988
Protein GI	159036735
COG category	[T] Signal transduction mechanisms
COG ID	[COG2205] Osmosensitive K+ channel histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0982705
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGAGC TGGCGCTGAT CTTCGCGTTC GCGCTCGGGC CGGCGCTCTG CGTCGGCGCC 
GCCGGCGCGC TCGCCCTGCG CCTGCTCCGC GGACGCTCGG TGACCGTGCA CATCGTCACC 
CTGCTGACGG TCGCGGTGAC CGCGGTGGTG GCCGCCGTGG CCGTCGTGGC CGACGCGATG 
TTCCTCTCCG CGCACGACCG CAACGTGGTG CTGATCACAG TTGCGGCCGC GGCGGTGGTG 
AGCCTCTCGG TCGGCTGGCT CTTCGGGCGT CGCCTGGCCG CCGCTGCCGT GTGGGCGGAC 
CAGGCCCGGC AGCGGGAGCG CCGGATCGAG CAGGGCCGAC GGGACCTGGT TGCCTGGGTG 
TCACACGACC TGCGGACCCC GCTGGCCGGG CTGCGGGCCA TGGCCGAGGC ACTGGAAGAC 
CGGGTGGTCG ACGACCCCGC GACGGTGGGC GAGTACCACC GCCGGATTCG GGTGGAGACC 
GACCGGATGA CCCGTCTGGT GGACGACCTG TTCGAGCTGT CCCGGATCAA TGCCGGCGCG 
TTGCGCCTGC ACCTGTCGGC GGTACCCCTG GGCGACGTCG TGTCGGACGC CGTCGCCAGC 
ACCACACCAC TGGCGACCGC CCGCCGAGTC CGTCTGCTGG CACCCGACTC GGGCTGGCCC 
ACCGTCCTGG CCAGCGAGCC CGAGCTGGCC CGGGTGGTGG GGAACCTCCT GCTCAACGCC 
GTCCGCTACA CACCGTCCGA GGGAACTGTC CGGGTCGAGG CCGGGGCGGA GACCGACTGG 
GCCTGGCTGG CCGTGGCGGA CACCTGCGGC GGCATCCCGG AGGAGGACCT GCCCCGCGTC 
TTCGATGTCG CCTTCCGCGG CGAGCGGGCA CGTACCCCCC ACCCCGGCAA CGGTGACCTG 
GCCAGCTCGG GGGGTCTGGG GCTGGCGATC GTACGAGGGC TGGTCGAGGC GCACGGCGGC 
CGGGTACACG TGCGGAACAC GACCGGCGGA TGTCGGTTCG AAATCCGGCT GCCGCTTCCG 
GGAACCATCG AAGCACATCG GCTGTCATAT CTATTTTCAT AG

Protein sequence

MRELALIFAF ALGPALCVGA AGALALRLLR GRSVTVHIVT LLTVAVTAVV AAVAVVADAM 
FLSAHDRNVV LITVAAAAVV SLSVGWLFGR RLAAAAVWAD QARQRERRIE QGRRDLVAWV 
SHDLRTPLAG LRAMAEALED RVVDDPATVG EYHRRIRVET DRMTRLVDDL FELSRINAGA 
LRLHLSAVPL GDVVSDAVAS TTPLATARRV RLLAPDSGWP TVLASEPELA RVVGNLLLNA 
VRYTPSEGTV RVEAGAETDW AWLAVADTCG GIPEEDLPRV FDVAFRGERA RTPHPGNGDL 
ASSGGLGLAI VRGLVEAHGG RVHVRNTTGG CRFEIRLPLP GTIEAHRLSY LFS