Gene RPD_4216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4216
Symbol
ID	4024737
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4682317
End bp	4683726
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	68%
IMG OID	637964422
Product	hypothetical protein
Protein accession	YP_571334
Protein GI	91978675
COG category	[R] General function prediction only
COG ID	[COG0661] Predicted unusual protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.332762
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.739533
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGTTAT GGGGACTGGT TTTGGCTCCG TTCCGCGCCA TCTTCACTCT GCCTGCCGCG 
AAGGAAGCCC CCGTGCCGCA TCGGAAGATC GAGAGGACCG CCTTCGAGAG GAGAGCGTTG 
GCCGTGCCGA GTTCGCGGCT GTCGCGGCTG GCGAAATTGG GCGGACTGGC CTCGTCGATC 
GCGGGCAATG TCGCCGCCGA GGTGGCGGGG CAGCTCGCGC GCGGCCAGCG CCCGCGGATC 
GAAGATCTGC TGCTCACGCC CGCCAACGCC ATCAAGGTCG CCGACAGGCT GGCGCAGATG 
CGCGGCGCGG CAATGAAGGT CGGCCAGCTG ATCTCGATGG ATGCCGGCGA CATGCTGCCG 
CCTGAACTGG CCGAAATCCT CGGCCGTCTG CGCTCGGAAG CGCATCACAT GCCGGTCGCG 
CAGTTGCGAC GGGTGCTGAC CGAGGCCTGG GGGCCGCATT GGCAGCGCCG GTTCGAGGTG 
TTCGACGCCC ACCCCGTCGC CGCGGCCTCG ATCGGCCAGG TCCACCGGGT GCGGACCACA 
GACGGCCGCG ATCTGGCGAT CAAGCTGCAA TACCCCGGCG TCCGCCGCAG CATCGATTCC 
GACGTCAACA ACGTCGCCTC GCTGATGCGC ATGGCCGGGC TGGTGCCCAG GGGCGTCGAC 
GTTGCGCCGA TGATCGCCGA GGCCAAGCGG CAGTTGCACG AGGAGGCCGA CTACGAACGG 
GAAGGCCGCT GTCTGTCGCA ATTCGGCGCG CTGCTCGCCG ACCGGCCCGA ATTCCGCGTG 
CCCGAGTTGC ACGCCGACCT GACGACGCCG AACGTGCTGG CGATGAGTTA CGTCGAGGGC 
GGACCGATTG ACAGCCTCGC CGACGCGCCG CAGGCGGAGC GCGACCGGGT GATGACGCTG 
ATGATCGGCC TCATTTTCCG CGAGCTGTTC GAATTCCGCC TGATGCAGAC CGATCCGAAC 
TTCGCCAATT ATCGTTATGT GCCGGCGACC GGGCAGGTGA TGCTGCTCGA CTTCGGCGCC 
ACCCGCGCCT TTCCGGCTGA TTTCGCCGAG CTCTACCGGC GGCTGTTGCG CGCAGGACTG 
GCCGGCGACC GTCCGGGCGT TCGCGCCGCC GCGCGCGAGA TCGGTTTCCT GGCCGGCAAC 
ACGCCTGCCC GGCTGGAACA GGCGATGCTC GAGATCTTCG AGATGTCGCT GCAACCGCTG 
CGGCAGGATG GGCCGTTCGA TTTCGGCGCC AGCGACCTCG CGATCCGGAT GCGCGAAGCC 
GGCATGGCGA TGGCCGCAGA CCACGCGCAT TTCCGGATTC CGCCGATGGA CACGTTGTTC 
CTGCAGCGCA AGTTCGGCGG CATCTACATG CTGGCGACGC GGATGCGGGC GCGGGTCGAT 
CTGCGCGCCC TCGTCGAGCC GCATCTGTGA

Protein sequence

MRLWGLVLAP FRAIFTLPAA KEAPVPHRKI ERTAFERRAL AVPSSRLSRL AKLGGLASSI 
AGNVAAEVAG QLARGQRPRI EDLLLTPANA IKVADRLAQM RGAAMKVGQL ISMDAGDMLP 
PELAEILGRL RSEAHHMPVA QLRRVLTEAW GPHWQRRFEV FDAHPVAAAS IGQVHRVRTT 
DGRDLAIKLQ YPGVRRSIDS DVNNVASLMR MAGLVPRGVD VAPMIAEAKR QLHEEADYER 
EGRCLSQFGA LLADRPEFRV PELHADLTTP NVLAMSYVEG GPIDSLADAP QAERDRVMTL 
MIGLIFRELF EFRLMQTDPN FANYRYVPAT GQVMLLDFGA TRAFPADFAE LYRRLLRAGL 
AGDRPGVRAA AREIGFLAGN TPARLEQAML EIFEMSLQPL RQDGPFDFGA SDLAIRMREA 
GMAMAADHAH FRIPPMDTLF LQRKFGGIYM LATRMRARVD LRALVEPHL