Gene RPB_2439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2439
Symbol
ID	3910228
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2794889
End bp	2795989
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	65%
IMG OID	637884338
Product	signal transduction histidine kinase
Protein accession	YP_486055
Protein GI	86749559
COG category	[T] Signal transduction mechanisms
COG ID	[COG3920] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0424622
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCG ATGAAGGGGG GCCGTCTCCG CAAAGCGTCG ACGGGATTTT AGGCTCGTCA 
AAGATTGCGG TGGCGATCGA GAACGACCGC TACAAGCACC TGCTCGACAA TGTTCCGGTG 
GCCCTCGCGG TGTCGCGTGG CAACGGCGAC GATCAGCGGA TCGTCTATAT CAATCACGCT 
TTCGAAGATC TGATGTCGCT GGCCCCGGCC GACATCGAGG GGCAGGGCTG GAACTGCCTC 
GATGCGTTGA TCAACGAAGA CGATACGGCG CTGACGCTCG GCGCGGCGAT CCGGGACGGC 
GAGGATTTCA TCGGCGTGTT CCGCCCCACC GTGCCGCCCG ACCGGGTGCT GATCGTGCAG 
GCCTACGCCT CCGTGATCGA GAGCGACGAC GGCGTCGAGA ATTTCCGGAT CGCGGCGTTG 
GTCGATGTCG GCGGACGCGA GCGGGCGCAG ATCGAGCTGT TCGAGTCCCA GATCCGTGAA 
CGCGACACCC TGATGCGCGA GCTGCAGCAT AGGGTGAAGA ACAATCTGCA ATTGGTGACG 
GCGCTGGTGC GGCTCGAAGC GCGTTCGGCG GCCGAAGGCG AGACCGTCGC GCTGACGCGG 
CTCGCAAGCC GGATCGATGC GTTGACCGCG CTGTACCGGA TTTTGTCCGC AGAGAGTGCC 
GCCGGCAGCG ATATCGATCT CGGCCAATAT CTGTCGGATG TCACCGAGGC GGTGATGCAG 
GCCCATGGCA GCGAGGGGAT CGCCTACGAC CTCAATGTCG GGTACTGCCC GCTCTCGGTC 
AATGTGGCGA TGCCCGCCGG CCTCCTGGTG AACGAGATGC TGACCAACGC GCTGAAATAC 
GCCTTCGTCG GACGCCGCGG CGGCCGGATC AAGGTGATCT GTAGCGTCGA GAACGGTCGC 
GTCTCGGTGA TCGTCTCGGA CGACGGCGCC GGCCTGCCGG AAGGCCAGGA ATGGCCGTCG 
CCGCGCAAGC TCGGCGCGCT GATCCTGCAG ACCCTCAAGG AAAACGCCCG CAACGTTACG 
TTCCGGGCAG AGAGCATTCG CGGGCAGGGC ACGTTGTTCG CCCTCGGCTT CGAAGCGCCA 
CCGGCTCCGG CGACGAATTG A

Protein sequence

MSADEGGPSP QSVDGILGSS KIAVAIENDR YKHLLDNVPV ALAVSRGNGD DQRIVYINHA 
FEDLMSLAPA DIEGQGWNCL DALINEDDTA LTLGAAIRDG EDFIGVFRPT VPPDRVLIVQ 
AYASVIESDD GVENFRIAAL VDVGGRERAQ IELFESQIRE RDTLMRELQH RVKNNLQLVT 
ALVRLEARSA AEGETVALTR LASRIDALTA LYRILSAESA AGSDIDLGQY LSDVTEAVMQ 
AHGSEGIAYD LNVGYCPLSV NVAMPAGLLV NEMLTNALKY AFVGRRGGRI KVICSVENGR 
VSVIVSDDGA GLPEGQEWPS PRKLGALILQ TLKENARNVT FRAESIRGQG TLFALGFEAP 
PAPATN