Gene RPD_3943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3943
Symbol
ID	4024459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4387641
End bp	4388867
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	58%
IMG OID	637964147
Product	hypothetical protein
Protein accession	YP_571065
Protein GI	91978406
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAAG ATCCTTTTTT CGGCCTCTCG GGAGACAGCA CTTGGAACGC TTGTATTGGA 
CCGCAGGGCG ACGAACTCCA CTACGTTGAA GGCTACCTGG AAGCGGCGAT CGAACTCGCC 
AACGCGGTGA TCGAGAAGAC CATGCTCGCC AAGCGCGATA CGCTCGTCCT CCCGATTCTG 
TACAACGCAC GCCACGCCAT TGAACTCGTT CTGAAATTCG TGACTGCACA ATTGTTCGAT 
TGCGGCATCA TCGCGGAGAA GCATCCCGCC AATCACGATA TCAAGGGGCA TTTTGATCAC 
CTAGTCGCGG CCAACGTCCC CGACGAAACC ATACGTGACG GCCTGAAGAC GCTAGAACGT 
TTCGTCGTCA GCCTCGACCG TATAGACGAT GATGGACAGG AATTGCGGTA CCACGTCAAT 
CGCGATGGCG AGACGAGCCT GAAGGGAGAA TCTCTAGCCA ATATCGCCGT CATCCGCGGA 
AGCCTCGACG AACTGTCGTC GGCCGTTACC GGATTGATGA ACCGGACGAT CGACTTGATC 
CAAGAACGGA AAGCCGGCGC GTACACTCCC CGTTGCTCGC GCGCGGACCT CCGCGCAATA 
GCCGGCATGA TGCCGCCGCT TGCCGAATGG GGCGGAGAAT CCTTCACTGC CGCGAAAGGC 
GCGGTGAAGG AGCGTTTTGC GCTCAGCAAC ACGCAGTTCA GCAGGGCAAT CGATGCGATC 
AAGGCGAACC GCGAATTAAA CGGGATGATC GGCGGCGAAA CCGAACTTCC GTGCCTCCTC 
GACGAGGAAG TGATGCTCGT CGTCGAGCAA TGGCGCATTC TTCATCCCAA ACGCGAGGAG 
AAAGAACCCG AAGTCGTCCA AGGGAAAAAC TTTAAGTTTG CAGATATGAT CAAGAGCATC 
AAAAAGAGTC GCGAATGCGT CGCGGCCCTG AGCAAAACGA TAACTAGTCA TGAAGCCGCG 
GACCTCGAAG CGCTCTTCTA TCTGGGTCGC GGAGATTTCT TTCCGGAGCA ATTGGAAGCT 
CGGGCTGCGA CCTACCTGGG GTCCCTGGTC GACGACTCGG AGGTGCGGGC CCGCACCGCA 
CAGCTATTGG AAAAGACGAA CCTTCTCGCC TGCCTGGAGC GAGGCGCGCG TCGGGCGGGG 
CGACTTTCTC TCGCCGAGAA GCTAGGCACG GCGCCGGCCG AGTCGAACCC AGTACAGGAC 
GGAGATTGCT CGAAGGTGGG GGAATGA

Protein sequence

MSEDPFFGLS GDSTWNACIG PQGDELHYVE GYLEAAIELA NAVIEKTMLA KRDTLVLPIL 
YNARHAIELV LKFVTAQLFD CGIIAEKHPA NHDIKGHFDH LVAANVPDET IRDGLKTLER 
FVVSLDRIDD DGQELRYHVN RDGETSLKGE SLANIAVIRG SLDELSSAVT GLMNRTIDLI 
QERKAGAYTP RCSRADLRAI AGMMPPLAEW GGESFTAAKG AVKERFALSN TQFSRAIDAI 
KANRELNGMI GGETELPCLL DEEVMLVVEQ WRILHPKREE KEPEVVQGKN FKFADMIKSI 
KKSRECVAAL SKTITSHEAA DLEALFYLGR GDFFPEQLEA RAATYLGSLV DDSEVRARTA 
QLLEKTNLLA CLERGARRAG RLSLAEKLGT APAESNPVQD GDCSKVGE