Gene RPB_2074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2074
Symbol
ID	3909889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2355890
End bp	2357686
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	70%
IMG OID	637883966
Product	radical SAM binding protein
Protein accession	YP_485691
Protein GI	86749195
COG category	[C] Energy production and conversion
COG ID	[COG1032] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0385557
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGCG CCGCGCGCGC GCCGCTGCGG GTGGCGCTGG TCGGGCCGCG CGAACAGCCC 
TTCGCCGGCG ATCCCGATCG CGAGCATCGC GAGACGATGC TGCGCAGCTA CGCGGAGATC 
TGCGACAGCG TCGCCACCTT CGGCTCGGAC TTCACGCTGT CGCGCGAATT TCTCGGCATC 
GAATATCTCG CGGCGACGCT GCGGCGCGAC GGCCGCATCG TCCGCGTGCT GTCCGCCGCC 
AATGAGGGGC TGGACGACGA TGCGCTGCTC GCCGAACTAC TGGCCTTCGC GCCGCGCATC 
GTCGGCCTCT CGGTGCTGTA CGATCTGCAA CTCGGCAATG CGCTGGTGCT GGCGCGGCGG 
CTGAAGGCGG CGCGGCCCGG TCTTGCCATC GTGTTGGGCG GTCCGCTCGC CACCGCGCTG 
TCGCAGGAAC TGCTCGGCAC CTTCGCCTTC GTGGACTACG TCGTCGAAGG CGAGGGCGAG 
GCGGCGTTGA GCCGGCTCGC TGATGCGATC GAACGCGGCG AGGCGCCGAG CGACGTGCCG 
GCGCTGGCGC ATCGCGGCCC GGGCGGCATC GTCCGCAATC CGCGCGGCGC GCCGCTCGAT 
CTCGACCGCC TGCCGCATCC GGCGCGCGAC GGCCTCGCGT CGATCCGCGC CCGCGGCCTG 
CCGGCGCCGA GCGCCTATCT CACCACCTCG CGCGGCTGCA AGGCGTTCTG CACCTTCTGC 
ACTGTGCCGG GCAGCGTGCG GAGCCTGAAG AGCGGCGTCT ACCGGATGCG CGATCCGGTC 
GACGTGGTCG ACGAGATCGA AGAGTTGGTG CGCGATCACG GCGTCAGCCG CTTCTACATG 
GCCGACGACA ATTTCCTCGG CTATGGCGAG GACAGCAACG CGCGGATGCA TCGCTTCGCC 
GACGAGATCC TGCGCCGCCG GCTCGCGATC CATTTCCACG CCGAATGCCG CGTCGACTCG 
CTGATCCCGG AGACTCTGGT CAGACTGCGC GCCGCCGGCT TCGACCAGAT CCTGTTCGGC 
CTGGAATCCG GCTCGGCGCG GACGCTGAAG CGCTGGGCCA AAGGCCAGAC GGTGGCGCAG 
AACGAGGCCG CGATCGCGCT GGCGCGGCGG TTGCGCATCG AGATGATGCC GAGCCTGATC 
CTGCTCGACT GGGAGTCCGA CCTCTCCGAG ATCGAAGAGA CGATCGGCTT CATCGAGCGC 
AACCAATTGT GGCGCAGCGG CCAGCCGCTG TGGCTGGTCA ACAAGCTCAA GGTCCATTGC 
GGCACCGCCG CCGCGCGCCG CTACGACAGC GTGCACGGCC GGCCGACGCC GCCCGCGGTC 
GGCTATTCCG ACGCCGATAT TCATCGTTGG TGCGAGACCG TGACCTATCA GCACGTCGGC 
ATCGACGATG TCTATGTCGC GGCGTTCTGG CGCGCGCTCA ACGCCGCCGC CAATCGCTGG 
TCGGTGCTGA TCGACGAGGT GCTGCCGCCG TTTCTGAAGA GCCTGCGCAG CGAGGCGCGC 
CGCGGCGACC GGACCGATCG CCTCGAACTG GTGCGCCGGC TCGCCGCGTT CCGCCGCTCG 
ATCGGGGCGT CGCTCGCCGC GCTGATGCGG CTGCTGATCG ATCAGGCGAT CGCGATGCAG 
CAGGCGCGCG CGCCGCAGCC GGATCTGCGC GGGCTCGCGC TGGCTCATGT CGAGGCGCAG 
GAGCGCCGCT TCTTTCCGGA GGGTCTGCAT GTGGCCTTGC AGGATACCGG CCGCCGCCGC 
GCCGTTGCTG GTCATGCCAT CGGCGCGCGG CTGGGCGAGA TCGTTTCGAC CGCGTGA

Protein sequence

MTGAARAPLR VALVGPREQP FAGDPDREHR ETMLRSYAEI CDSVATFGSD FTLSREFLGI 
EYLAATLRRD GRIVRVLSAA NEGLDDDALL AELLAFAPRI VGLSVLYDLQ LGNALVLARR 
LKAARPGLAI VLGGPLATAL SQELLGTFAF VDYVVEGEGE AALSRLADAI ERGEAPSDVP 
ALAHRGPGGI VRNPRGAPLD LDRLPHPARD GLASIRARGL PAPSAYLTTS RGCKAFCTFC 
TVPGSVRSLK SGVYRMRDPV DVVDEIEELV RDHGVSRFYM ADDNFLGYGE DSNARMHRFA 
DEILRRRLAI HFHAECRVDS LIPETLVRLR AAGFDQILFG LESGSARTLK RWAKGQTVAQ 
NEAAIALARR LRIEMMPSLI LLDWESDLSE IEETIGFIER NQLWRSGQPL WLVNKLKVHC 
GTAAARRYDS VHGRPTPPAV GYSDADIHRW CETVTYQHVG IDDVYVAAFW RALNAAANRW 
SVLIDEVLPP FLKSLRSEAR RGDRTDRLEL VRRLAAFRRS IGASLAALMR LLIDQAIAMQ 
QARAPQPDLR GLALAHVEAQ ERRFFPEGLH VALQDTGRRR AVAGHAIGAR LGEIVSTA