Gene RPD_1998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1998
Symbol
ID	4022480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2234685
End bp	2236082
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	67%
IMG OID	637962191
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_569134
Protein GI	91976475
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.374305
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGCC CGGCCGTTCT CGTCAAACCG CCGCGCCGCA GTGGCAGCTC GCTCGCCACG 
CGACTGTTTC TGTCGGCGAC CGCCTGGGTG GTGGTGATCC TGGCGATCAC CGGCATCGTG 
CTGTCCTCGG TGTATCGGCA GGCGTCCGAG CGCGCGTTCG ATCGCCGGCT CAATCTCTAT 
CTGCGCACCA TCATCGCCGA AGTCGCGACG CCCGAAGCCG CGCCGGACCA GTTTCAGTCG 
ATCGGCGAGC CGCTGTTCGA TCTGCCGCTG TCGGGCTGGT ACTGGCAGAT CGTCCGCACC 
GACACCGACA AGATCGACCC GCGCGCCTCG CGTTCGCTAT GGGACCGCAA GCTGCCGAAG 
CTCGAGGACC AGGGCGTCGA ACTCGGCGCG TCCGGTGTCC GCCAAGGCTA TGTCGAGGGA 
CCGGAAGGCC AGACCCTGCG CATGGTCGAG CGCCCGGTCG ATCTCGGCGC CGACGGCAAA 
TTCGTCGTGA CGGTGGCCGG CGACGGCAGC GAAATCTTCG AGGAAACAAG GACCTTCGAC 
TATTACCTCG CCGGCACCTT CATCGCGCTG TCGATCGGGC TGGTGCTGAC CACGATCTTT 
CAGGTCCGGT TCGGCCTCGC GCCGCTGAAA CGGATCTCCG ACTCGATCGC CGACATCCGC 
TCCGGCCGCG CCGAGCGGCT CGAAGGCAAG TTCCCGGTCG AGATCGCGCC GCTGGCCCGC 
GAGACCAACG CACTGATCGA GGCCAATCGC GAGATCGTCG AACGCTCGCG CACCCATGTC 
GGCAATCTCG CCCATGCGAT CAAAACGCCG CTCTCGGTGC TCGTCAACGA AGCCGCCGCG 
CGGAGTGGCG ATCCGTTCGC CGCCAAGGTG CTGGAGCAGG CCGAAATCAT GCGCAGCCAG 
GTCACGCATC ATCTGGAGCG GGCGCGGATC GCAGCACGGC TGACCGTGGT CGGCACTGTC 
ACCGAGGTCG AACCGGTGAT CGAGGCGCTG CGCCGGACGA TGGAGAAGAT CCATCGCGAC 
CGCGACATCC TGGTCCGCTC CGAGGTCGCC AGCGGCCTCA AATTCCGCGG TGAAAAGCAG 
GACCTCGAGG AGATGGTCGG CAATCTGGTC GACAATGCGT GCAAATGGGC GGTGAGCCGG 
GTGTTCATCG ACGTGACCGC CGAGCGCGGC CCGACGCCGC TGGTCCGCAT CATCGTCGAC 
GATGACGGTC GCGGCCTGTC GGCGGCGGAG CGGGCCCAGG CCGCCCGCCG TGGTCAGCGG 
CTCGACGAGA GCAAGCCGGG CTCCGGCCTC GGGCTCGCGA TTGTCGTCGA TCTTGCAGCA 
CTTTACGGCG GCGAGCTGAA GCTCGCTCAC GCCCCGATCG GCGGCCTGCG GGCCGAACTG 
AGGTTGCCTG CGGCGTAA

Protein sequence

MASPAVLVKP PRRSGSSLAT RLFLSATAWV VVILAITGIV LSSVYRQASE RAFDRRLNLY 
LRTIIAEVAT PEAAPDQFQS IGEPLFDLPL SGWYWQIVRT DTDKIDPRAS RSLWDRKLPK 
LEDQGVELGA SGVRQGYVEG PEGQTLRMVE RPVDLGADGK FVVTVAGDGS EIFEETRTFD 
YYLAGTFIAL SIGLVLTTIF QVRFGLAPLK RISDSIADIR SGRAERLEGK FPVEIAPLAR 
ETNALIEANR EIVERSRTHV GNLAHAIKTP LSVLVNEAAA RSGDPFAAKV LEQAEIMRSQ 
VTHHLERARI AARLTVVGTV TEVEPVIEAL RRTMEKIHRD RDILVRSEVA SGLKFRGEKQ 
DLEEMVGNLV DNACKWAVSR VFIDVTAERG PTPLVRIIVD DDGRGLSAAE RAQAARRGQR 
LDESKPGSGL GLAIVVDLAA LYGGELKLAH APIGGLRAEL RLPAA