Gene RPC_0672 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_0672
Symbol
ID	3970611
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	732724
End bp	733950
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	66%
IMG OID	637923788
Product	hypothetical protein
Protein accession	YP_530563
Protein GI	90422193
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.532138
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGAA CTTTCTTCGC CCCGGCCGCC GATCGGTCAA GCGTAGCGCC GGCGAAGCTG 
CCTGCCCTGA GCGCCAAGCG CCGATCATGT TTCAGGGTGG AACTGCATTC GGATTTCAGC 
AACGCCGAGT TTCGCCACAC CTGGAAATCG TTCGAGCAAT CGGCGACGGC CACGGCGTTC 
CAGCGCCTGT CCTACATCCA GGCGCTGCTC GCCAACATCG TGCCGCAGCG AGCGGTGGAA 
CCGATCCTGG TCGGGGTGCG CGACACCAGC TGCGGCGCGA TCGTGCTGGT CGCGTCGCTG 
ATGCGGACCC GCCGCCACGG CGTGTCGGTC ATCGAGGCGC TCGATCTCGG GCTGTGCGAC 
TATTTCGCCC CGTTGATCCG TCCCGGCCTT GAATTCAGCG CGGTGGAGTT TGACGAGCTT 
TGGCGCGAGA TTTGCGGCGC GCTGAAGCCG GTCGGCGCGC TCTCGATCGA GAAGATCCCC 
GCTGAGATCT TCGGCTATCC CAATCCGCTC GCCAAGCTGC CGTCGGCACG GCCGACCAAC 
GACTTTGCGA CGACCTTGCG GATGCGCGCG GCGGATGGCG CCCACTTGGT GGATCTGCAG 
AGTTATTCGG TGGTGCGAAA GGCCAACCGG CTGTGCCGAA AGCCGGAGAA CTGGGGCAAC 
ATCCAACTGG AATTGGCAGA CACCGCAGCC GCGCTGCAGC AAGCGCTCGA CCTGATGGTC 
GCGCATCGGC TGGTTCGGTC CCACGCGCTG GGACGCCATG ACCTGCTCGA CGACCGCGGA 
TTCATCGCGT TCTACCGGCA ACTCGCGCAG GATGGGCTGG CGGACGGCTC GGTCCGGGTG 
TTCGTGCTGT CCTCCGATGC TGAGCCGATC GCCGTGGTCT ATTCGCTCGT GCATCGCAAT 
GCGCTGACGG TGGTGGTGCC TTCGATGACC ACGGAGGAGC GGTGGCGCAA ACTGTCGCCC 
GGGCTGGTCG CGATGGTGAA ATGCTGCGAA TGGGCCGACC GCGAGGGCTT TCACAACTTC 
GATCTCAGCG TCGGCGCGCT GCAATACAAA ACCCGGTTCG GCGGCGATCA GCGCCGGCTG 
TACGAAATCC GTCAGGCGCT CTCGCCGGCC GGCCTGCTGA TCACCGCTGA AGTGACGGCG 
AAGCGCCGGC TGCGCGCCTT CGCCGCCCGC CACCCGAAGG CCAAGGCGCT GGTGCGCCGC 
ATGCTGCGCC GGCCGCCGGC TACCTGA

Protein sequence

MNRTFFAPAA DRSSVAPAKL PALSAKRRSC FRVELHSDFS NAEFRHTWKS FEQSATATAF 
QRLSYIQALL ANIVPQRAVE PILVGVRDTS CGAIVLVASL MRTRRHGVSV IEALDLGLCD 
YFAPLIRPGL EFSAVEFDEL WREICGALKP VGALSIEKIP AEIFGYPNPL AKLPSARPTN 
DFATTLRMRA ADGAHLVDLQ SYSVVRKANR LCRKPENWGN IQLELADTAA ALQQALDLMV 
AHRLVRSHAL GRHDLLDDRG FIAFYRQLAQ DGLADGSVRV FVLSSDAEPI AVVYSLVHRN 
ALTVVVPSMT TEERWRKLSP GLVAMVKCCE WADREGFHNF DLSVGALQYK TRFGGDQRRL 
YEIRQALSPA GLLITAEVTA KRRLRAFAAR HPKAKALVRR MLRRPPAT