Gene RPD_1948 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1948
Symbol
ID	4022430
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2186339
End bp	2187385
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	66%
IMG OID	637962141
Product	polysaccharide deacetylase
Protein accession	YP_569084
Protein GI	91976425
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.171917
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAAG TTGTGGCGTT GACGGCAGGC TGCAGTGCCC TGGCCGTTCT GGTTGGCCTC 
GGTGCGGGAC GCGCTTATTT CTCGGCCCCG AGCGCGCAGA CTGTTGCGGC CTCCTCCGAA 
CTCACCACCG GCGCGATCGC GTCGCGCTGG CCGACCCCGA CCTCCGAGTC GTCCAAGGCG 
CCGGCGCCGA CAATTCAGCC CGCCGTCGCC AGGGAGCCCG CAGCGATGCC TGCGCCTGCG 
CCGGCCCCCG CGCCTGTCCA AGCCTGCAAC AATCCAGACG CGCTCGGCAT CTCGCGCACC 
GTCGAGATCG ACACCAATGG CGGACCGGGT CTCGGCATGT CGCAATATCG CGACTACGAC 
TTCCTGCAGC CCGGCGAAGT CGCGCTGACC TTCGACGACG GTCCGTGGCC AGTGAACACG 
CCGGCGGTTC TCGCGGCGTT GGCGGCGCAG TGCGTCAAGG CGGTGTTCTT CCCGATCGGC 
AAACATGCCA GTTGGCATCC TGCGATCCTC AAGCAGGTCG TGGCCGCGGG CCACACCGTG 
GGTTCGCACA CCTGGTCGCA CGTCAATCTC GCGACCAAGC CGTTTGCGGA CGCCAAGACC 
GAGATTGAAA AGGGCATCAG CGGCGTCGCG CTCTCGGCCG GGCAGCCGAC CTCGCCGTTC 
TTCCGCTTCC CGCAGCTTCG GCAGACGCAG GATCTCAAGG CCTATCTCGG CGAGCGCAAC 
ATCGCGACGT TCTCGATCGA CATCGACTCC GAGGATTTCC GCATCCACAA GCCGGATCAA 
CTGATCACCG CGGTGATGAC CAAGCTGAAG AAGGCCGGCA AGGGCATCCT GCTGATGCAC 
GATTTCCAGC AATCGACCGC GCAGGCGCTG CCCGAGTTAC TCGCGCAACT CAAGGCCGGC 
GGCTACAAGA TCGTGTTCAT CACCGCCAAG GACAAAGTGA ACACGCTGCC GGAATACGAC 
GCACAGGTCG CCCCTGCGCA GCCGGCCGTC AGCAATGCGC GGCCGATCGG CAACGTGATC 
CGCACCGTCG GCGGCAACGC GAAGTAA

Protein sequence

MRKVVALTAG CSALAVLVGL GAGRAYFSAP SAQTVAASSE LTTGAIASRW PTPTSESSKA 
PAPTIQPAVA REPAAMPAPA PAPAPVQACN NPDALGISRT VEIDTNGGPG LGMSQYRDYD 
FLQPGEVALT FDDGPWPVNT PAVLAALAAQ CVKAVFFPIG KHASWHPAIL KQVVAAGHTV 
GSHTWSHVNL ATKPFADAKT EIEKGISGVA LSAGQPTSPF FRFPQLRQTQ DLKAYLGERN 
IATFSIDIDS EDFRIHKPDQ LITAVMTKLK KAGKGILLMH DFQQSTAQAL PELLAQLKAG 
GYKIVFITAK DKVNTLPEYD AQVAPAQPAV SNARPIGNVI RTVGGNAK