Gene RPD_1840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1840
Symbol
ID	4022322
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2059175
End bp	2060551
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	64%
IMG OID	637962034
Product	Beta-glucosidase
Protein accession	YP_568977
Protein GI	91976318
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.185877
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACACGC TCACACCGCC GACCCAGATG CCGATGCCGG GTCATCCATC ACTTTTGCAC 
GTCAAGCCCG ATTTCATCTG GGGCGTGTCC AGTTCGAGCT TTCAGATCGA GGGCGCCACC 
AACGAAGACG GCCGCGGCGC GAGCATCTGG GACACCTATT GCCGCACCGG ACAAGTCGCC 
AACAACGACA CCGGCGACGT CGCCTGCGAC CATTATCATC GCTACAAGGA AGACGTCGCG 
CTGATGAAGG CGCTCGGCGT GCAGGCCTAT CGTTTCTCCA TTGCGTGGCC GCGCGTGCTG 
CCGCTAGGCG ACGGCGCGGT GAACGAAGCC GGCCTCGCCT TCTACGACCG GCTGATCGAC 
GAACTTCAGG CCGCCGGGAT CGAGCCGTGG ATCTGCCTGT ATCACTGGGA CCTGCCGCAA 
GCGCTGGAAG ACCGCGGCGG CTGGCTCAAC CGCGACATCG TCGGCTGGTT CGCCGACTAT 
GCAAGGCTGA TCGGCGAGCG TTACGGCAAG CGGGTGAAGC GGTTCGCAAC CTTCAACGAA 
CCGGGGATCT TCAGCCTGTT CAGCCGCTCC TTCGGGGCGC GCGACCGCAG CGCCGACGAC 
AAGCTCCACC GCTGGATCCA TCACGTCAAT CTCGCCCATG GCGCCGCGGT CGATGCGCTG 
CGCGAGACGG TGCCGGACGC ACAGATCGGC CTGGTTACAA ATTATCAACC AATCTTCCCA 
TCGAGCGACA AGCCCGAGGA CATCGCCGAA GCCGCGCTGA TCGGCGACTA CTGGAATTGT 
GCCTTCTCCG ATCCGCAATA TCTCGGCGAG TATCCGGCCC TGATCCGCGA CGCGCTCGCG 
GCGCACGTCA GGCCGGGCGA CATGGAGCAG ATTCACCGGC CGCTCGACTG GTTCGGGCTG 
AACCACTACA GCCCGGTCTA CATCAACTCC GATCCGAATG CGATCATCGG GCTCGGCTGG 
GGCGCGAAGC CCGACAGCAT TCCGCGGACG CCCATCGACT GGACGATCGA ACCGGACGCC 
TTCCGCGACA CGCTGATCGA GGTCAGCCGA CGCTACGGCA AGCCGGTCTA CGTCACCGAG 
AACGGTTATG GCAGCAACAT CGAAAAGCCG GACGACACCG GCGCGGTGAT CGATCGCGGC 
CGCGTCGCCT TCCTGCACGA CTACATCTCC GGCCTCGACG CGGCGATTGC CGCCGGCGCC 
GACGTGCGCG GCTATTTCGT CTGGTCGCTG CTCGACAATT TCGAATGGGA GTCGGGCTAC 
GGCGTGCGTT TCGGCCTGAC CTATATCGAC TACGCGACGC AGCGGCGGAT TCCGAAGGCG 
TCGTTCAATT GGTACGCGGA CGTCATTCGT CAGGCCCGCG GCGGCGCGAC CGCGTAA

Protein sequence

MDTLTPPTQM PMPGHPSLLH VKPDFIWGVS SSSFQIEGAT NEDGRGASIW DTYCRTGQVA 
NNDTGDVACD HYHRYKEDVA LMKALGVQAY RFSIAWPRVL PLGDGAVNEA GLAFYDRLID 
ELQAAGIEPW ICLYHWDLPQ ALEDRGGWLN RDIVGWFADY ARLIGERYGK RVKRFATFNE 
PGIFSLFSRS FGARDRSADD KLHRWIHHVN LAHGAAVDAL RETVPDAQIG LVTNYQPIFP 
SSDKPEDIAE AALIGDYWNC AFSDPQYLGE YPALIRDALA AHVRPGDMEQ IHRPLDWFGL 
NHYSPVYINS DPNAIIGLGW GAKPDSIPRT PIDWTIEPDA FRDTLIEVSR RYGKPVYVTE 
NGYGSNIEKP DDTGAVIDRG RVAFLHDYIS GLDAAIAAGA DVRGYFVWSL LDNFEWESGY 
GVRFGLTYID YATQRRIPKA SFNWYADVIR QARGGATA