Gene RPD_3571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3571
Symbol
ID	4024085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3975928
End bp	3977088
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	63%
IMG OID	637963775
Product	radical SAM family protein
Protein accession	YP_570695
Protein GI	91978036
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID	[TIGR03470] hopanoid biosynthesis associated radical SAM protein HpnH

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.22168
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATAC CGTTTCACAA GGAGATCCGG ATCGGCGGCT ATCTGCTCAA GCAGAAGCTG 
CTGGGCCGCA AGCACTACCC GCTGGTGCTG ATGCTCGAGC CGCTGTTCCG TTGCAATCTG 
GCCTGCGTCG GCTGCGGCAA GATCGATTAT CCCGATGCGA TCCTGAACCG CCGGATGTCC 
GCGCAGGAAT GCTGGGACGC CGCCGAGGAA TGCGGCGCGC CGATGGTTGC GATCCCGGGC 
GGCGAGCCGC TGATCCACAA GGAGATCGGC GAGATCGTGC GCGGCCTGGT GGCGCGCAAG 
AAGTTCGTGT CGCTGTGCAC CAACGCGCTG CTGCTCGAGA AGAAGCTGCA CCTGTTCGAG 
CCGTCGCCGT TCCTGTTTTT CTCGGTGCAT CTCGACGGCC TGAAGGATCA TCACGACAAG 
GCGGTGTCGC AGGCCGGCGT GTTCGATCGC GCGGTGTCGG CGATCAAGGC GGCGAAGGCC 
AAGGGCTTCA CCGTCAACGT CAACGCGACG ATCTTCGACA ACCATCCGGC CGAGGAGATC 
GCCAAGTTCC TCGACTTCAC GACCGAACTC GGCGTCGGCG TCTCGATGTC ACCGGGCTAC 
GCTTATGAGC GTGCGCCCGA TCAGGAGCAC TTCCTGAACC GGACCAAGAC GAAGAAACTG 
TTCCGCGACG TTTTCGCGCT CGGCAAGGGC AAGAAGTGGA ACTTCATGCA TTCCGGCCTG 
TTTCTGGACT TCCTTGCCGG AAATCAGGAG TTCGAATGCA CCCCGTGGGG AATGCCCGCG 
CGCAATATCT TCGGCTGGCA GAAGCCGTGC TACCTGCTCG GTGAAGGCTA CACCAAGACC 
TTCAAGGAGC TGATGGAGAC CACCAACTGG GATTCCTACG GCACCGGCAA GTACGAGAAG 
TGCGCGGACT GCATGGCGCA TTGCGGCTAC GAGCCGACCG CGGCGACGGC GTCGCTGAAC 
AATCCGCTGA AGGCGGCCTG GGTCGCGTTG CGCGGGATCC GGACCTCGGG TCCGATGGCG 
CCCGAGATCG ATCTGTCGAA CCAGCGTCCG GCTCAGTACA TCTTCGCCGA GCAGGTGCAG 
AAGACGCTGT CAGAGATCCG CCGCGACGAG GCTGCCGCTG CCAATCACGG CGCCAAGCAC 
GAAGCTTCGA CAGCCGCGTA G

Protein sequence

MAIPFHKEIR IGGYLLKQKL LGRKHYPLVL MLEPLFRCNL ACVGCGKIDY PDAILNRRMS 
AQECWDAAEE CGAPMVAIPG GEPLIHKEIG EIVRGLVARK KFVSLCTNAL LLEKKLHLFE 
PSPFLFFSVH LDGLKDHHDK AVSQAGVFDR AVSAIKAAKA KGFTVNVNAT IFDNHPAEEI 
AKFLDFTTEL GVGVSMSPGY AYERAPDQEH FLNRTKTKKL FRDVFALGKG KKWNFMHSGL 
FLDFLAGNQE FECTPWGMPA RNIFGWQKPC YLLGEGYTKT FKELMETTNW DSYGTGKYEK 
CADCMAHCGY EPTAATASLN NPLKAAWVAL RGIRTSGPMA PEIDLSNQRP AQYIFAEQVQ 
KTLSEIRRDE AAAANHGAKH EASTAA