Gene RPD_4244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4244
Symbol
ID	4024765
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4712135
End bp	4713937
Gene Length	1803 bp
Protein Length	600 aa
Translation table	11
GC content	69%
IMG OID	637964450
Product	protein-disulfide reductase
Protein accession	YP_571362
Protein GI	91978703
COG category	[C] Energy production and conversion [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4232] Thiol:disulfide interchange protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.438007
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGACC GCATTGTCCG CATTGTTATC CTGCTCGTCG CGATCGCGGC GGGCGCCGAG 
GCAGCGTATG CCGCCAAGGC CGCGCCGTTC CAGCTCAGCG CCCAGCCCGG CGCCAACGGC 
GTCGATCTGA CCTGGCGGAT CGCCTCCGGC GATTATCTCT ACCGCGACAA GATCGTCGTC 
ACCACCGCCG ATGGCGCCCG CGTTGCGGTC CAGACCCCGA CTGGCGAGCT CAAGGACGAT 
CCGAATTTCG GCATGACCGA GATCTATCAC CGCAGCGTGA CCGCGACGAT CCCTGCTGAC 
GCGGTGAAGA GTGCGAGCCG CTTGATGGTG ACGTATCAGG GCTGCGCCGA GCGCGGCATC 
TGCTATCCGC CGATGACGGC AAGTGTCGAT CTCGGCACCT ATCAGGTCTC AGCCGCGAGT 
GGAGAAACGC CGAGCGCCGG CCAGGCCCGG ACATCGGACC TGCCCATTAT TCCGCAGCTC 
GCCGAGCCGG CAGCCGAGCC GGCGACGGTC GCCGCATCGG TGCTGCCGTC GATGACGCAG 
GGCTGGTTGC CGCTGCTGCT CGCCTTCGCC GGGTTCGGAC TGCTGCTGGC GTTGACACCC 
TGCGTGCTGC CGATGATCCC GATCGTCGCC GGCATGCTGA CCCGGTCCGG CCCCGGCATC 
TCGCCGGCGC GTGGCTTCGC GCTGGCCGCC ATCTACACCC TGGCGATGGC GTCGGCTTAC 
GCCGCGCTGG GCGTCGCAGC GGCGTGGTCG GGGCAGAATC TACAAGGCGC GTTGCAGGCG 
CCGCTGGCGC TGGCCGTGAT GGCGTCGATC TATGTTGCGC TGGCGCTGTC GAGCTTCGGC 
TTGTTCGAGC TGCAATTTCC GGCCGGGTTC GGCGGCAACC TCGCCGGCCG GCTGAACGGC 
CGCGCCGGAC CGTTGCTCGG CGCAGCGGCG CTCGGCTTCA CCTCCGCGCT GATCGTCGGA 
CCATGCGTGA CTCCACCGCT CGCCGCGGCG CTGCTCTATG TCGCGCAGAC CGGCGATGCG 
CCGCGCGGCG CATCGGCGCT GTTCGCGCTC GGCCTCGGCA TGGGATTCCC TTTGATCCTG 
GTCGGCCTGT TCGGCGCCGG CGTGCTGCCG CGGTCCGGCC CCTGGCTGGT GACGATCCGC 
AAGCTGTTCG GCTTCGTGTT TCTCGGCCTC GCGGTCGCGC TGATCTCGCG GGTATTGCCC 
GGCGTGGTGA CGCTGCTGTT GTGGGCCGGC ATCGCGTTCG GTCTCGCCGC GTTTCTCGGC 
GCATTCGATC AGCTCGACCG GCTCGGCGGC GCGCTCAGGC GTTCAGGCAA GGCGGCGGGT 
CTCGCCGTCT TCGTTTACGG CGCGACGCTG ATCGTCGGCG CCGCCGGCGG CAGCGACGAT 
CCGTTGCGGC CGCTCGCGGT GTTCGGCGCC GACCCGACGC CGGCGACCGC GATCGTCGCC 
CGGACGGTGA CCTCGATGCC CGCGCTGGAC CAGGCGATCA GCGACGCGCG GGCGCGCGGC 
AAGCCGATCA TGATCGACTT CACCGCGGAG TGGTGCACCT CGTGCAAGAC CATGGATCGC 
AACGTGTTCG GCGATCCCGC CGTCCGGCAA CGCCTGAAGG ACGTCGCGCT GATCCGCGCC 
GACGTCACCA AGACCAACGC CGACACCGCG GCGCTGATGA AGCGCTTCGA CGTCGTCGGC 
CCGCCGACCG TGGTGTTTCT CGATCAGCGC GACGGCAGCG AAATCCCCTC CGCCCGCACC 
ATTGGCGAAG TCTCCGCCGA CGCGTTCTTC CAGACGCTCC AGCGCGTCGG TTCGTCGTCC 
TAA

Protein sequence

MADRIVRIVI LLVAIAAGAE AAYAAKAAPF QLSAQPGANG VDLTWRIASG DYLYRDKIVV 
TTADGARVAV QTPTGELKDD PNFGMTEIYH RSVTATIPAD AVKSASRLMV TYQGCAERGI 
CYPPMTASVD LGTYQVSAAS GETPSAGQAR TSDLPIIPQL AEPAAEPATV AASVLPSMTQ 
GWLPLLLAFA GFGLLLALTP CVLPMIPIVA GMLTRSGPGI SPARGFALAA IYTLAMASAY 
AALGVAAAWS GQNLQGALQA PLALAVMASI YVALALSSFG LFELQFPAGF GGNLAGRLNG 
RAGPLLGAAA LGFTSALIVG PCVTPPLAAA LLYVAQTGDA PRGASALFAL GLGMGFPLIL 
VGLFGAGVLP RSGPWLVTIR KLFGFVFLGL AVALISRVLP GVVTLLLWAG IAFGLAAFLG 
AFDQLDRLGG ALRRSGKAAG LAVFVYGATL IVGAAGGSDD PLRPLAVFGA DPTPATAIVA 
RTVTSMPALD QAISDARARG KPIMIDFTAE WCTSCKTMDR NVFGDPAVRQ RLKDVALIRA 
DVTKTNADTA ALMKRFDVVG PPTVVFLDQR DGSEIPSART IGEVSADAFF QTLQRVGSSS