Gene RPD_3754 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3754
Symbol
ID	4024270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4190097
End bp	4191548
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	64%
IMG OID	637963958
Product	chlorophyllide reductase subunit Z
Protein accession	YP_570876
Protein GI	91978217
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01278] light-independent protochlorophyllide reductase, B subunit [TIGR02014] chlorophyllide reductase subunit Z

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00589159
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTTGTCC TGGATCATGA TCGCGCCGGC GGTTATTGGG GCGCCGTCTA TGCCTTCACC 
GCGGTGAAGG GCCTGCAGGT GATCATCGAC GGCCCGGTCG GCTGCGAGAA CCTGCCGGTC 
ACCTCGGTGC TGCATTACAC CGACGCGCTG CCCCCGCACG AATTGCCGAT CGTCGTCACC 
GGTCTCGGCG AAGACGAACT CGGCAAGCTC GGCACCGAAG GCGCGATGAA GCGCGCGCAC 
CGCACGCTCG ACCCGTTCCT GCCTGCCGTG GTGGTGACAG GTTCGATCGC CGAAATGATC 
GGCGGCGGCG TCACGCCCGA AGGCACCAAC ATCAAGCGCT TCCTGCCGCG CACCATCGAC 
GAAGACCAGT GGCAGAGTGC TGACCGCGCC ATCGTCTGGC TGTGGAAAGA ATACGGCCCG 
AAGAAGATTC CGGAGCGCAA GCCGCTGTCG CCGGACGTCA AGCCGCGGGT GAACATCATC 
GGCCCGATCT ACGGCACTTT CAACATGCCG TCCGACCTCG CGGAAATCCG CCGCCTGATC 
GAAGGCATCG GCGCCGAAGT CAACATGGTG TTTCCGCTCG GCTCGCACCT CGCCGATATT 
CCGAAGCTGG TGAATGCCGA CGTCAACGTC TGCATGTACC GCGAGTTCGG CCGCCTGCTG 
TGCGAGGCGC TGGAGCGGCC CTATCTGCAG GCGCCGATCG GGTTGCATTC AACCACGCGC 
TTCCTGCGCA AGCTCGGCGA GCTCACGGGT CTCGATCCGG AGCCGTTCAT CGAGCGTGAG 
AAGAACACCA CGATCAAGCC GCTGTGGGAC CTGTGGCGCT CGGTGACCCA GGACTTCTTC 
GGCACTGCGA GCTTTGCGGT CGTCGCCACT GATACTTATG CCCGCGGCGT GCGAAATTTC 
CTCGAGACGG AAATGGGCCT GCCGTGCACC TTCGCAGTGT CGCGCAAGGC CGGCGTGAAG 
CCGGACAATG ACGCGGTTCG CACCGCGATT CGGCAGACTC CGCCGCTGAT TATGTTCGGT 
AGCTACAACG AAAGAATGTA CCTCGCCGAA TCGGGCTCGC GCGCGATCTA CATCCCGGCG 
TCGTTTCCGG GCGCGGTGAT CCGCCGCCAT CTCGGTACGC CGTTCATGGG CTACTCGGGC 
GCGACCTATC TGGTGCAGGA AGTGTGCAAC GCGCTGTTCG ATGCGCTGTT CAACATCCTG 
CCGCTCGGCA GCGATCTCGA TCGCGTCGAT CCGACTCCGG CGCGTCGTCA CGAAGAGCTG 
CTCTGGAGCG ACGAAGCCAA GGCGCTGCTC GACGAAGTGC TCGAGGCGCA TCCGGTGCTG 
GTGCGGATTA GCGCAGCAAA GCGTTTGCGC GACGCAGCTG AAAACAGCGC GCGCCGTGCC 
GGCCAAGAGC AGGTGACGAA AGAATTTGTC AGTAAAGCAC GTGCGGCGCT CTTGGATGGG 
CAGTCGGCGT GA

Protein sequence

MLVLDHDRAG GYWGAVYAFT AVKGLQVIID GPVGCENLPV TSVLHYTDAL PPHELPIVVT 
GLGEDELGKL GTEGAMKRAH RTLDPFLPAV VVTGSIAEMI GGGVTPEGTN IKRFLPRTID 
EDQWQSADRA IVWLWKEYGP KKIPERKPLS PDVKPRVNII GPIYGTFNMP SDLAEIRRLI 
EGIGAEVNMV FPLGSHLADI PKLVNADVNV CMYREFGRLL CEALERPYLQ APIGLHSTTR 
FLRKLGELTG LDPEPFIERE KNTTIKPLWD LWRSVTQDFF GTASFAVVAT DTYARGVRNF 
LETEMGLPCT FAVSRKAGVK PDNDAVRTAI RQTPPLIMFG SYNERMYLAE SGSRAIYIPA 
SFPGAVIRRH LGTPFMGYSG ATYLVQEVCN ALFDALFNIL PLGSDLDRVD PTPARRHEEL 
LWSDEAKALL DEVLEAHPVL VRISAAKRLR DAAENSARRA GQEQVTKEFV SKARAALLDG 
QSA