Gene RPD_2063 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2063
Symbol
ID	4022545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2311136
End bp	2312281
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	68%
IMG OID	637962256
Product	hypothetical protein
Protein accession	YP_569199
Protein GI	91976540
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.80257
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.561686
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGACA TGTTCGAGAC CGCGAGTTGC TTCCGCCGCC GGTTTGTGGC TGGCGCTGTG 
CTGTTCGCCG CTGTGCTTTT GGACATGGCG ACGCTTGGCT CCGGCGCGAG CGCGCAGCAG 
GGCTATCCGC CTCCGGGCGG CGCGCCGCAA GCCGCGGTCA ATCCGGTCTG CCCGCGGCTC 
GAGGCACAGC TCGCCTCGAT CGACCGCGGC GGCGCCGACC CGGCGCGCGC CGAGCAGATC 
CGGCGCTACG AGGATTCCGT GAACCGCCAG CAGGCCGAGC TCGATCGGGT CACGATGCAG 
GCGAAGCGGA TGGGCTGCGA CAGCTCCGGC TTCTTCTCGC TGTTCAACGG CCAGTCGGCG 
CAATGCGGCC CGGTCAATAA TCAGATCCAG CAGATGCGCG GCAATCTCGA CCAGATGACC 
TCCGGCCTCG AGCGGCTACG CGGCGGCGGC CCTGGCGGCG GCGAGCGCGA CAACCAGCGC 
AGGTCGGTGC TGATGGCGCT GGCGCAGAAC AATTGCGGCC CGCAATATGC CGCGGCGGCG 
CAAGGCGGCG GCGGTTTTCT CGATAATCTG TTCCGCGGCA ACCCTCAGGG CGCTCCCAGC 
GCGCTGCCCG ATTTCAACAC CGACTCCGGC ACCTTCCGCA CGGTCTGCGT CCGCACCTGC 
GACGGTTTCT ACTTCCCGAT CTCCTTCGCC ACCGTGCCGG CACGCTTCGC CGATGACGAG 
AAGACCTGCA AGAACCTGTG CCCGGCGTCC GAAGCGGCGC TTTACGCTCA CCGCAATCCG 
GGCCAGGACA TGAACCAGGC GGTATCCATC AACGGCCAGC CCTACACCTC GCTGCCGGCA 
GCATTCCGCT ATCGTCAGGA GTTCAACCCG GCTTGCTCGT GCAAGGCGGC GAATCAGAGC 
TGGGCGGACG CGCTGAAGGG CGTCGACGAT ACCTCTGCAC GCGAACACGG CGACATCATC 
GTCACTGAAG AGAGCGCGAA GCGGATGGCG CTGCCGCCAG CGCAACGGGC GGCAGCCCAG 
CGCAAGGGCA CCACCGCAGC GCCTGCGCCC GCAACTGGCG ACGCCAAGCC GCCGGCGACG 
ACGGGGTCGT CCGATCCGAA CACGATCCGC TCAGTCGGCC CGACCTTCCT GCCGAAGATG 
CAGTAA

Protein sequence

MPDMFETASC FRRRFVAGAV LFAAVLLDMA TLGSGASAQQ GYPPPGGAPQ AAVNPVCPRL 
EAQLASIDRG GADPARAEQI RRYEDSVNRQ QAELDRVTMQ AKRMGCDSSG FFSLFNGQSA 
QCGPVNNQIQ QMRGNLDQMT SGLERLRGGG PGGGERDNQR RSVLMALAQN NCGPQYAAAA 
QGGGGFLDNL FRGNPQGAPS ALPDFNTDSG TFRTVCVRTC DGFYFPISFA TVPARFADDE 
KTCKNLCPAS EAALYAHRNP GQDMNQAVSI NGQPYTSLPA AFRYRQEFNP ACSCKAANQS 
WADALKGVDD TSAREHGDII VTEESAKRMA LPPAQRAAAQ RKGTTAAPAP ATGDAKPPAT 
TGSSDPNTIR SVGPTFLPKM Q