Gene Sare_0403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0403
Symbol
ID	5703796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	464255
End bp	465532
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	71%
IMG OID	641269928
Product	histidine kinase
Protein accession	YP_001535323
Protein GI	159036070
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00335965
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGAGTGGG CAGTGGTGGT CGCGTTGGCC GTAGGGCTGG CGGTCGGTGT GCTGCTGACC 
CGTGTCGTCG TGGCGCGGCG GGGCCGATCC ACCGTGACCG GGAGCCGCCA ATCCGACTCC 
AACCGACCCG GGGGGAGACC CGCGATAGCC GACGATCCGC AGTCCGGCTT TGGTCGCCGG 
ACAATTGACT CCCTCCGGGT CGGCGTCGTC GTGCTCGCCG CCGACGACGT ACCTGTCCTG 
GTCAACCCGG CAGCCCGCGC GATGGGGCTG CTCCGCGCCG GCGGCGTCCC GGGCGCGGTC 
GCCGCCCATC CGCTGATCCG GACGCTCGCC GGGCAGGTGC GGCGGACCGG CGTGCGTCGA 
GAGATCCAGC TGGACCTGCC CCGGGGGCAC GACGGCGCCG CGGAGAATCC GCTCGGCGTG 
CACCTGCGGG CAGTCGGGCT CGGGAGCGGC CATGTCGCCG TGGAGGCCGT TGACGTGACC 
GAGTCGCACC GGCTGGCCCG GGTCCGGCGC GACTTCGTGG CCAATGTGAG TCATGAGTTG 
AAAACGCCCA TCGGGGCGCT CCAACTGCTC GCCGAAGCGC TGCTCGACGC GACCGAACCG 
GCCGGCGCGG AGCGGCCGGA CCTCTCCGAG GACCTGGTCG CCGCACGCCG GTTCGCCGAA 
CGGATTCGGC ACGAATCAAC CCGTCTGGGC CGGTTGGTGC AGGAACTGTT GGAGCTGACC 
CGGCTCCAGG GCGCCGAGCC ACAGCCCGCG CCGGAGCCCG TCGCCGTGGA CTGGGTCATC 
GGCGAGGTGG TGGACCGGAC GCGGACCGGA GCCAGCGCCC GGAGGATCGA CGTGGTGGTC 
GACGGCGAGC GTGGGTTGAC CGTGTATGGC AGCGACACCC AACTGGCTAC CGCCGTGTCG 
AACCTCGTCG AGAACGCCAT CAACTACTCG GGTGAGGACA CCACCGTCCG GATCACCGCC 
GGGCTGGACG ATGAACACGT CACGATCGCC GTCACCGACC AGGGCATCGG GATAACCCCG 
GGCGACGTGG ACCGGATCTT CGAGCGCTTC TACCGGGCCG ACCAGGCGCG GTCCCGCGCG 
ACCGGCGGCA CCGGTCTCGG GCTCGCCATC GTCAAGCACA TCGCCAGCAA CCATGGCGGA 
AGGGTCGAGG TCGCGAGCAC TCTTGACGAG GGGTCGACGT TCACCCTCCG GCTGCCTGCT 
CGTCCACCGG ACGACCTGTC GGTGATACCG CCCTCGGTTG AGATCGAGGC CGGTCCGGCC 
GAGTTCCGGC AGGTGTAA

Protein sequence

MEWAVVVALA VGLAVGVLLT RVVVARRGRS TVTGSRQSDS NRPGGRPAIA DDPQSGFGRR 
TIDSLRVGVV VLAADDVPVL VNPAARAMGL LRAGGVPGAV AAHPLIRTLA GQVRRTGVRR 
EIQLDLPRGH DGAAENPLGV HLRAVGLGSG HVAVEAVDVT ESHRLARVRR DFVANVSHEL 
KTPIGALQLL AEALLDATEP AGAERPDLSE DLVAARRFAE RIRHESTRLG RLVQELLELT 
RLQGAEPQPA PEPVAVDWVI GEVVDRTRTG ASARRIDVVV DGERGLTVYG SDTQLATAVS 
NLVENAINYS GEDTTVRITA GLDDEHVTIA VTDQGIGITP GDVDRIFERF YRADQARSRA 
TGGTGLGLAI VKHIASNHGG RVEVASTLDE GSTFTLRLPA RPPDDLSVIP PSVEIEAGPA 
EFRQV