Gene RPD_4054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4054
Symbol
ID	4024571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4504908
End bp	4506350
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	66%
IMG OID	637964257
Product	hypothetical protein
Protein accession	YP_571174
Protein GI	91978515
COG category	[R] General function prediction only
COG ID	[COG3800] Predicted transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.568607
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0971132
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGGTG AATCCGGGAA AAAGCTGTTC GTCGGACCCC GGTTCCGCCG AATCCGTCAG 
CAGCTTGGCC TGTCGCAGAC CCAGATCGCC GAGGGACTGG GGATCTCGCC GAGCTATATC 
AACCTGATCG AGCGGAACCA ACGGCCGGTG ACCGCACAGA TCCTGCTGCG ATTGGCGGAA 
ACCTACGACC TCGATCTGCG CGACCTCGCC ACCGCCGACG AGGACCGGTT CTTCGCCGAG 
CTCAACGAAA TCTTTTCGGA CCCGCTGTTC CGCCAGATCG ACCTGCCGAA GCAGGAGCTG 
CGCGACCTCG CAGAGCTTTG CCCCGGCGTC ACCCATTCAC TCCAGCGGCT TTACGCCGCC 
TACACCGAGG CGCGGCGCGG CGAAACGATG GTCGCGGCGC AGATGGCCGA CCGCGAACAG 
ATCCGCTACG AGGCCAACCC GATCGAGCGC GTTCGCGATC TGATCGAGGC CAACCGCAAC 
TATTTTCCGG AGCTGGAGCA GGCGGCGGAA GCGGTGCGCG ACGAACTCAA CGTCAGTTCG 
CAGGATGTCT ACGGCGCGCT CGACGACCGC CTGCGCGAGC GCCACGCGAT CACAACCCGG 
ATCATGCCGG TCGACGTGAT GCGGGAGACG CTGCGCCGGT TCGACCGCCA CCGCCGGCAA 
TTGCTGATCT CGGAATTGAT CGACGGGCCG GGCCGCGCCT TCCAGATCGC GTTCCAGACC 
GGCCTCAGCG AGCATGGCGG CGTGATCGAC GCCATCGTGC ACCGCTCCGG CGCGCTCGAC 
GAGCCGGCGC GGCGGCTGTA CCGCATCACC CTCGGCAACT ACTTCGCCGC CGCGGTGATG 
ATGCCCTACG CCGCGTTCCT CACCGCCGCG GAGCAGCTCA GCTACGACGT CAACGTGCTG 
GCGCAGCGCT TCAACGCCGG TTTCGAACAG GTCTGCCACC GCCTCACTAC GCTGCAGCGG 
CCGAACGCGC GCGGCGTGCC GTTCTTCCTG CTGCGGGTCG ACAATGCCGG TAACGTCTCC 
AAGCGTTTCT CCTCCGGCAC CTTCCCGTTC TCGAAATTCG GCGGCACCTG CCCGTTGTGG 
AACGTGCACT CGACCTTCGA CACGCCGGAT CGCCTCCTGA AGCAGGTGAT CGAACTGCCC 
GACGGCAGCC GCTACTTCTC GATCGCCCAG ATGGTCCGCC GGCCGGTAGC GCCGCATCCG 
CAACCGCAGC CGCGCTTCGC GCTCGGCCTC GGCTGCGAAA TCCGCCACGC CGCCAAACTG 
ATCTACGCCG CCGGGATGGA TCTGGAGAAA GCCGAAGGCA CCCCGATCGG CGTCAACTGC 
CGCCTCTGCG AACGCGAACA CTGCAGCCAG CGCGCCGAGC CGCCGATCAC CCGGACGCTG 
ATCCTGGACG AGAACACAAG GCGAGCGAGC AGCTTTGCGT TCAGCAATGC GCGGGAGTTG 
TGA

Protein sequence

MAGESGKKLF VGPRFRRIRQ QLGLSQTQIA EGLGISPSYI NLIERNQRPV TAQILLRLAE 
TYDLDLRDLA TADEDRFFAE LNEIFSDPLF RQIDLPKQEL RDLAELCPGV THSLQRLYAA 
YTEARRGETM VAAQMADREQ IRYEANPIER VRDLIEANRN YFPELEQAAE AVRDELNVSS 
QDVYGALDDR LRERHAITTR IMPVDVMRET LRRFDRHRRQ LLISELIDGP GRAFQIAFQT 
GLSEHGGVID AIVHRSGALD EPARRLYRIT LGNYFAAAVM MPYAAFLTAA EQLSYDVNVL 
AQRFNAGFEQ VCHRLTTLQR PNARGVPFFL LRVDNAGNVS KRFSSGTFPF SKFGGTCPLW 
NVHSTFDTPD RLLKQVIELP DGSRYFSIAQ MVRRPVAPHP QPQPRFALGL GCEIRHAAKL 
IYAAGMDLEK AEGTPIGVNC RLCEREHCSQ RAEPPITRTL ILDENTRRAS SFAFSNAREL