Gene RPD_4416 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4416
Symbol
ID	4024941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4887560
End bp	4888666
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	66%
IMG OID	637964625
Product	metal-dependent phosphohydrolase
Protein accession	YP_571533
Protein GI	91978874
COG category	[T] Signal transduction mechanisms
COG ID	[COG2206] HD-GYP domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCAG TAGCCCGACA ATCCGCGCCC CAGTCCGAAC CGCGACGGCG GCTGCTGCTG 
GCGTCCGATC GCCGAGATCA GAGCGCCGAC CTCGCCCGGA TCCTGGCCGG CATCGCCGAG 
ATCGAAACCA TCTCCACCGC GCAACTACCC GACGTGCCGT CGCAGAACCT GTCCGGGATC 
GTCGTCGACA TCAATCTGCG GTCCGCGGAA AGCGTGCAGA TGGTCCGGCG CAAGCTGTTG 
GGCGGCGGCT ATCAGCCGAT CCCGCGGCTG TTCGTGCTCG CCGACGAATT GCATCATGGC 
TCGATGCAGG CCTGGGCGCT CGGTGCCACC GACACCATCG CGCGTCCGTT CGACCCGCGT 
GACCTGCTGG CGCGGATCCG TGCTGCGTTC CCCGATCCCT CGGAGACGAC CGAAGCCGCG 
CGCGCCGAGG CAATGAGCAA GGGCGTCGCG GCCGCGCACA GCGTATTGGT CAAGATCTTC 
GACCGGCTGC CGGCGGGCCA GCCTTTGACG TATCACGACG TGATCCGGGC CGAGGCGCCG 
ATCCTCAAGG CGATCAAGCG CTCGTCGCTG CGCGAATGGC TCGCCGTCGT CGGCCGTCAC 
CACAACGAAA GCTACCGACT CGCTTTGTTC GCGACCGGCT ATGCCGTCGC CTTCGCCCAG 
CATCTCGGTA TGCGCGAGGA AGATCAGCGT CGTCTGACCC GCGCTGCGCT GCTGTACGAC 
GTCGGCAAGG CGTTCGTCGA CGTCGGTGTG CTCGACGATC TCGACGGTCT GCAGGGCGAA 
CGCTTGCACA AATTCCGCGA GCATCCGCGC CGAGGCTACG AAGCGCTCGC CGCCGAGGGC 
AGCTTTCCGC GAGAGACCCT CGATGTGATC CTGCATCATC ACGAGCTGCT TGACGGCTCG 
GGCTATCCCG ATGCGCTGCA TGGCGACCAG ATCAGCGACA TCGTCCGCAT CACCACCATC 
GTCGACATCT TCACCTCGCT GGTGGCGCCG CGCAAAAATC ACGTCCCGCT GATGCCGTTG 
CACGCGTTCT CCCGGATGGA ATCGATGGGC GACAAGATCG ATCAGCGCCT GCTGCAGGCG 
TTCCGCCCGG TCCCGCTCGG CGGCTAG

Protein sequence

MNAVARQSAP QSEPRRRLLL ASDRRDQSAD LARILAGIAE IETISTAQLP DVPSQNLSGI 
VVDINLRSAE SVQMVRRKLL GGGYQPIPRL FVLADELHHG SMQAWALGAT DTIARPFDPR 
DLLARIRAAF PDPSETTEAA RAEAMSKGVA AAHSVLVKIF DRLPAGQPLT YHDVIRAEAP 
ILKAIKRSSL REWLAVVGRH HNESYRLALF ATGYAVAFAQ HLGMREEDQR RLTRAALLYD 
VGKAFVDVGV LDDLDGLQGE RLHKFREHPR RGYEALAAEG SFPRETLDVI LHHHELLDGS 
GYPDALHGDQ ISDIVRITTI VDIFTSLVAP RKNHVPLMPL HAFSRMESMG DKIDQRLLQA 
FRPVPLGG