Gene Sare_0424 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0424
Symbol
ID	5708401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	484122
End bp	485438
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	73%
IMG OID	641269949
Product	histidine kinase
Protein accession	YP_001535344
Protein GI	159036091
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.680525
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00719111
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCGCTG CACGCGTGGC CGCCACGCCC GCTCCCAGCC CCAGCCGCAA CCTGTTCCGC 
CAACTTCTGC GCGACTCGGG CTACGTGCTG TCGGGCCTGC CCCTCGCCAT AGTCGGCTTC 
GTGGTGGCCG TCACCGGGTT CTCGCTCAGC CTTGGTCTGC TGGTGACCGC CCTGGGCCTG 
CCGGTCCTGG CCGGCACGTT GTACGCCGTC CGGGTGCTGG CCGACGTCGA ACGGATCCGG 
CTGCCCGCCG TGCTGGGCGT GCCCCGGATC CGCCCGGTCT ACCGCGTACC CGACTCGGGT 
GCCAGCTTCT GGCGCCGAAC CCTGACGCCG GCCCGGGACC TGCAGTCGTG GCTCGATCTG 
CTGCACGCGT TCTGCAAGAT GCCGGTGGCG ACGGTGACCT TCTCGGTGCT GCTGACCTGG 
TGGGCGCTGG CGGTCGCCGG CGTCAGCTAC GGGGCCTACG ACCGGGCGAT CCCGTACGGT 
CCGAACGACC AGAGCCTGAG CGCACTTCTC GGGATGGGCA ACGGCTCCGG CGCCCGGATC 
TTCCTGAACA CCGCCATCGG GGTGTTCGCC CTGCTCACCC TGCCGCTGGT CGCTCGCGCG 
TGTGCCCGGA TCGAGGGCAG CCTGTCCCGC TCGCTCCTGA CCGGCGTGGC CGAGATGCGT 
AACCGGATCA CCATCCTCGA GGAGCAGAAG CGCGCGGCGG CCTCCGCCGA GGCGAACGCG 
CTGCGCAAGC TGGAACGCGA CATCCACGAC GGACCGCAGC AGCGGCTGGT CCGGCTCGCG 
ATGGATCTCA GCCGGGCCCG CGAGCAGCTC GCCGACGACC CGGTGGCGGC CGGGCACACG 
CTCGACGAGG CAGTCGGCCA GACCCGGGAG ACCCTGACCG AGCTGCGTGC GCTGTCCCGC 
GGCATCGCAC CGCCCGTCCT GGTCGACCGA GGGCTACCGA GCGCGCTAGC GGCGCTGGCC 
GGACGCGGAC TGATCCCGAT CGAACTGCGG GTGGACGCCG GGCTCGGCGA GCCGGGCGGT 
CGGCCCGACC CGACGGTGGA GAGCACGGCG TACTTCGTGG TCGCCGAGGC GCTCACGAAC 
GTCGCGAAGC ACAGCCGAGC CACCGAGTGC CGAGTCACCG TGGAGCGGGC CGGGGAGCGG 
CTGCGAGTCG GCATCGACGA CGACGGCCAG GGCGGCGCGC ACCTGGCCAA GGGGCACGGG 
CTGGTCGGCA TCGCGGACCG GGTCCGGGCG GTCGGCGGGC AGCTCTCCGT GACCAGCCCG 
GCCGGCGGAC CGACCGAGGT GTGCGCCGAC CTCCCCGCGA CGCCCGGCCC GTGGTAG

Protein sequence

MTAARVAATP APSPSRNLFR QLLRDSGYVL SGLPLAIVGF VVAVTGFSLS LGLLVTALGL 
PVLAGTLYAV RVLADVERIR LPAVLGVPRI RPVYRVPDSG ASFWRRTLTP ARDLQSWLDL 
LHAFCKMPVA TVTFSVLLTW WALAVAGVSY GAYDRAIPYG PNDQSLSALL GMGNGSGARI 
FLNTAIGVFA LLTLPLVARA CARIEGSLSR SLLTGVAEMR NRITILEEQK RAAASAEANA 
LRKLERDIHD GPQQRLVRLA MDLSRAREQL ADDPVAAGHT LDEAVGQTRE TLTELRALSR 
GIAPPVLVDR GLPSALAALA GRGLIPIELR VDAGLGEPGG RPDPTVESTA YFVVAEALTN 
VAKHSRATEC RVTVERAGER LRVGIDDDGQ GGAHLAKGHG LVGIADRVRA VGGQLSVTSP 
AGGPTEVCAD LPATPGPW