Gene RPC_3454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3454
Symbol
ID	3972122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	3829952
End bp	3831091
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	71%
IMG OID	637926565
Product	hypothetical protein
Protein accession	YP_533313
Protein GI	90424943
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.199214
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTCGG TTACGATTTG TTCACCAGAA CGGGCCGCAG CCGCGCCGTG GGACGATCTG 
GTGCGGCGCG CCTCGCCCAA CGTGTTCATG AATCCGGCGG CGCTGCGCGC GGCGCAGGAC 
TGCGGCTTCG CCGACATCCG GGTGCTGCTG GCCTTCGACG AGGCCGCCTC GCCGCGGGCG 
CTGGTCGGGC TGTGGGCGCT GCAGCGCCGC GTGGTCGCGC CGCTGCTGCC GGCGATCCTC 
GAGGCCTTGC CGTTCTACTA TGCCTTCCTG TCGAGCCCGG TGGTCGATCC GGGGTTCGCC 
GACGAGGTGA TGCCGGCGTT CCTCGCGGCG ATCGAACGCG ATCCCGCGCT GCCCCGGGTG 
ATCACGCTGA AATCGCTCGA CGCCGAAGCG CCGAGCTATG CCGCGCTGCG CACCGCGTTG 
AGCGGGAAGG GCGGCGCGCA GCTCGCGCTG AAACAATTCG CCCGGCCGTT CGCCACCAAG 
GACCACGGCA TCAAGCGTTC CGGCTCGACC CGCAAGAAGC TGCGGCAGGA CTGGAACCGG 
CTTTCCGCGC TCGGCGCCGT CGAGCTGGTC AACGACCGCT CGGCCGCTGG CGTCGCGGCG 
GCATTCGAGA GCTTTCTGGC GCTGGAGGCG GGCGGCTGGA AGGGCGCGCG GGGCACCGCG 
CTGACCTGCG ATCCGCGCCA TGCCCGCTTT ACCCGCGAAT TGATCCGGGC GCTGGCGGCG 
CGCGGCGACG CCAGCGTGGC GCTGCTGCGG GTCGAGGGAC GGGCGATCGC GGCGCAAGTG 
CTGATGTATT GTGGAACCAG CGCCTACACC TGGAAGACCG GCTACGACGC CGAATTCGCC 
AAATTCTCGC CGGGCGCGCT GTTGATCGAC AAGCTCGCCG AAGCGCTGTT CGCCGACGGG 
GTGATCGACA CCATCGATTC TTGCTCGGTG CAGGACAGCT TCATGGCGCA GCTGTGGAGC 
GGCCGGCGCG CCATGGTCGA CCTAGTGGTC GACGTCGGGC CGGGCCGCTC GTTCGGATTC 
GCCGTCGAGA CCGCGCGGCA GCGCGGCATC GCGCGGCTGC GAGAACTCCG CAACCGGCTG 
CGGGCCTGGC GGGCAGTCCC GCCGGCGCCG AAGAAGCCGC CGGTGCCGCG CGAGGCGTGA

Protein sequence

MISVTICSPE RAAAAPWDDL VRRASPNVFM NPAALRAAQD CGFADIRVLL AFDEAASPRA 
LVGLWALQRR VVAPLLPAIL EALPFYYAFL SSPVVDPGFA DEVMPAFLAA IERDPALPRV 
ITLKSLDAEA PSYAALRTAL SGKGGAQLAL KQFARPFATK DHGIKRSGST RKKLRQDWNR 
LSALGAVELV NDRSAAGVAA AFESFLALEA GGWKGARGTA LTCDPRHARF TRELIRALAA 
RGDASVALLR VEGRAIAAQV LMYCGTSAYT WKTGYDAEFA KFSPGALLID KLAEALFADG 
VIDTIDSCSV QDSFMAQLWS GRRAMVDLVV DVGPGRSFGF AVETARQRGI ARLRELRNRL 
RAWRAVPPAP KKPPVPREA