Gene RPD_2589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2589
Symbol
ID	4023085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2901035
End bp	2902207
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	63%
IMG OID	637962786
Product	signal transduction histidine kinase, nitrogen specific, NtrB
Protein accession	YP_569719
Protein GI	91977060
COG category	[T] Signal transduction mechanisms
COG ID	[COG3852] Signal transduction histidine kinase, nitrogen specific
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.206184
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0145748
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTCG TCCTTGAACA GCGCCACGCC AAGCCGACCG AAAGCGATGC GATCCTCAAC 
GCGCTGCCCA ATCCCGTGCT GCTGATCGGG CCGGACGGCA AGATCATCGA TGCCAACATG 
GCGGCGGAAT CGTTCTTCGA GATTTCGACG CAGCTCTTAC GGCGGCAATC ACTGACCGAG 
CTGGTGCCGT TCGGCAGTCC GCTCCTGGCG CTGATTGACC AGGTCCGCAG CGGCAATTCG 
CCGGTCAACG AGTACAAGGT CGATCTCGGC ACGCCGCGGA TCGGTTCCGA TCGCCAGGTC 
GATCTGCACG TCGCGCCGCT GAACGAGCGT CCGGGGCATA TTGTCGTGAT GCTGCAGGAG 
CGTACCATCG CGGACAAGAT GGACCGGCAG CTCACCCATC GCAGCGCCGC GCGCTCGGTG 
ATCGCGCTGG CGGCGATGCT CGCGCACGAG ATCAAAAACC CGCTGTCCGG CATCCGCGGC 
GCGGCGCAAT TGCTCGAGCA GCAGGCGTCG TCGGAAGACC GGATGCTGAC GCGGCTGATC 
TGCGACGAGG CCGACCGCAT CGTCACCCTG GTCGATCGCA TGGAAGTGTT CGGCGACGAC 
CGCCCGGTGG CGCGCGGGCC GGTCAACATT CATTCCGTGT TCGATCACGT CAAACGGCTG 
GCGCAGTCCG GCTTCGCACG CAACATCAAA TTCGTCGAGG ACTACGACCC GTCGCTGCCG 
CCGGTGCTCG CCAATCAGGA TCAGCTGATT CAGGTGTTTC TCAACCTCGT GAAGAACGCC 
GCCGAAGCCG TTGTCGATCT CGGGAGCGAC GCCGAGATTC ATCTCACGAC CGCGTTTCGT 
CCCGGCGTGC GGCTGTCGGT GCCGGGCAAA AAGACTCGTG TGTCACTGCC GCTGGAATTC 
TGCGTCAAGG ACAACGGTCC CGGCGTGCCG GAAGACCTAT TGCCGAATCT GTTCGATCCG 
TTCGTCACCA CCAAGGCGTC GGGATCCGGG CTCGGGCTCG CGCTGGTCGC CAAGATCGTC 
GGCGATCACG GCGGAATCAT CGAGTGTGAA TCGCAGCCAC GCAAGACCTC GTTCCGCGTG 
CTGCTGCCGA TGTTCAGCAC GGCGAAGAAC GGCAATCAAA GCAACGGCGA GGACGTGCCG 
GCGTCATCCC ATGCCTCTCA GACTGCAAGA TGA

Protein sequence

MTVVLEQRHA KPTESDAILN ALPNPVLLIG PDGKIIDANM AAESFFEIST QLLRRQSLTE 
LVPFGSPLLA LIDQVRSGNS PVNEYKVDLG TPRIGSDRQV DLHVAPLNER PGHIVVMLQE 
RTIADKMDRQ LTHRSAARSV IALAAMLAHE IKNPLSGIRG AAQLLEQQAS SEDRMLTRLI 
CDEADRIVTL VDRMEVFGDD RPVARGPVNI HSVFDHVKRL AQSGFARNIK FVEDYDPSLP 
PVLANQDQLI QVFLNLVKNA AEAVVDLGSD AEIHLTTAFR PGVRLSVPGK KTRVSLPLEF 
CVKDNGPGVP EDLLPNLFDP FVTTKASGSG LGLALVAKIV GDHGGIIECE SQPRKTSFRV 
LLPMFSTAKN GNQSNGEDVP ASSHASQTAR