Gene RPD_1900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1900
Symbol
ID	4022382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2134256
End bp	2135494
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	66%
IMG OID	637962093
Product	radical SAM family protein
Protein accession	YP_569036
Protein GI	91976377
COG category	[R] General function prediction only
COG ID	[COG4277] Predicted DNA-binding protein with the Helix-hairpin-helix motif
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.308107
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGTGC AGCGCAAGCT GGCCATTCTG GCGGATGCGG CGAAATACGA CGCCTCCTGC 
GCCTCGAGCG GGACGGAGAA ACGCGACAGC CGCGACGGCA AGGGGCTGGG CTCGACCGCG 
CCCGGCATGG GGATCTGCCA TTCCTATGCG CCGGACGGCC GCTGCATCTC ACTGTTGAAG 
GTACTGCTCA CCAACGCCTG CAACTATGAC TGCCTGTATT GCGTCAACCG CGCTTCGTCG 
AACGTGCCGC GCGCGCGCTT CACCGTCGAC GAGGTGGTGC AGCTCACGCT CGACTTCTAT 
CGCCGCAACT ACATCGAGGG GCTGTTCCTG TCGTCGGGCA TCATCCGCAG CGCCGACTAC 
ACCATGGAGC AGATCGTCGA GGTCGCGCGC CGCTTGCGGG AGGAGCACCA TTTCCGCGGC 
TACATCCATC TCAAGACAAT CCCGGAGGCC GACGACGCGC TGATCAGCAA AGCCGGCCGC 
TATGCCGATC GCCTCAGCAT CAATATTGAA GTGCCTGAGG AGCAAAGCCT CGCCGCGCTG 
GCGCCGGAGA AGAACGTCCG CGCCATCCGC CGCACTATGG GGCGGCTGCG GCTGAAGCTC 
GACGAGGCCA AGGAGGCGCG CACCGCGCCG AGCCGCGCCA AGCCGCCGCG CTTCGCCCCG 
GCCGGCCAGA GCACACAGAT GATCGTCGGC GCCGACGCCG CCACCGACCA GACCATCCTC 
GACACCAGCG CCAATCTCTA CGGTTCCTAC AATCTCAAGC GGGTGTACTA CTCGGCGTTC 
AGCCCGATTC CGGATTCCAG CCGCGCCCTG CCGCTGCAGG CTCCGCCGCT GATCCGCGAG 
CACCGGCTGT ATCAGGCCGA CTGGCTGATG CGGTTCTACG GCTTCGACGC CGGCGAAATC 
ATTGACCCGT CCGCAGGTAT GCTGTCGCTG GAGATCGACC CGAAGCTCGC CTGGGCGCTG 
CGGCATCGCG AGCGCTTCCC GCTCGACGTC AACCGCGCCA GCCGCGAGGA TCTGCTTCGG 
GTTCCGGGCT TCGGCCGCAA AGCCGTCGAG CGCATCATCG CAACGCGGCG ACACAGCGCG 
ATCCGCAGCA TGGATCTCGC GCGCCTGCAC ATCCCGCGGA ACAAGGCGCT GCCGTTCATC 
GTTCTCTCCG ACCACCGCCC GACGCCGCAT CTCCTCGACA GCGCGCGGCT GGCGGAACGG 
TTCCGGCCGA AGGCGCAGCA ACTTGGATTT GGATTCTAA

Protein sequence

MDVQRKLAIL ADAAKYDASC ASSGTEKRDS RDGKGLGSTA PGMGICHSYA PDGRCISLLK 
VLLTNACNYD CLYCVNRASS NVPRARFTVD EVVQLTLDFY RRNYIEGLFL SSGIIRSADY 
TMEQIVEVAR RLREEHHFRG YIHLKTIPEA DDALISKAGR YADRLSINIE VPEEQSLAAL 
APEKNVRAIR RTMGRLRLKL DEAKEARTAP SRAKPPRFAP AGQSTQMIVG ADAATDQTIL 
DTSANLYGSY NLKRVYYSAF SPIPDSSRAL PLQAPPLIRE HRLYQADWLM RFYGFDAGEI 
IDPSAGMLSL EIDPKLAWAL RHRERFPLDV NRASREDLLR VPGFGRKAVE RIIATRRHSA 
IRSMDLARLH IPRNKALPFI VLSDHRPTPH LLDSARLAER FRPKAQQLGF GF