Gene RPD_3254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3254
Symbol
ID	4023763
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3608614
End bp	3610077
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	65%
IMG OID	637963457
Product	sulfatase
Protein accession	YP_570379
Protein GI	91977720
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1368] Phosphoglycerol transferase and related proteins, alkaline phosphatase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.233953
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCGATAC CTTCCATTGC CGACTACTCG ACCGCGATTG ACGGTCGACT CCTGGCCGCG 
CGGTCGGCCC GCTTCGTCCA CGCGAACATC CGGCTCATCG CCGGCGGGCT GTTGATCCCG 
AACCTGCTGT CGCTGGCGAC GATGATCTCG CTGATCGATA TCGGCCTGCC GCCGCGCACC 
GAGGCGATCC TGTTTTACGC ATGCGTGGCC ATGCTGGCCC GGCGCCTGCC GTTCGTCATC 
ATCGTTCCGC TGTTCCTCAC GGTGCTGAGC TTCGACATCG TGCGCACGTT GTCGTTGATG 
TTCAGCGTGG CGCCCGTCGA GTTCTTGGAG GCGATCGATC GTGCGCAGCG GATCCAGTTC 
TTTGCCTCGC CATTGTATGT CGCCCTGATC GTCACGATCG CGGCGACGAC TGTCGCGGCG 
CTGGTCTGCC TCAGCCGCCG CTCTGCGCTG ACGAACGCGA GCGCGCCGGC ATTCTTTGTT 
CTGGCGCTGG GCGTCGCGGC GATCGACTTC ATCGGCAATG TTTCGCCGCA CTATCATTTC 
GGGGCGACCA TTGGCTTCGA GCAGCCGGTT CAGTCGGCCG CGGAAGCGTC CGGCTTCAAG 
CAGACGGCCG GCGCGGAAGG CCGCAACGTC GTGCTGGTGA TGGTCGAAAG CCTCGGCTAT 
CTGCGCGATC CCGCAGCGCG CCAGCGGATC GCCGCGCCGC TGTACGATCC GGCCTTGACG 
AGGGACTACG CTGTCACCTC GGGGCAGACG GTGTATTACG GTTCGACGAC CTCGGGCGAG 
ATGCGAGAGC TGTGCGATAC GCGTTCGTTC TACAAGGACT TCGTTCAGCA CGACACCGAC 
GCCTGCCTGC CGAATCTGAT GGCCCGGCGC GGCTACAGCA CCGTCGCGGT GCATGGCTTC 
TCGGGCGGCA TGTTCGAGCG CGAACACTGG TATCCGACCA TCGGCTTCGA CCGCTCGCTG 
TTCGGCGAGA AGCTGCTCAA AGCCACCGGT CGCGAATGCG GCGCCGCCTT CCGCGGCGTA 
TGCGATGCGG ATTTCGCGCC GCTGATCGCA GCGGCGTCGC GTGACGCCGA CGCCGGCGGC 
AAGCCGCGCT TCATCTATTG GCTGACCCTC ACCAGCCACG TGCCGATCGC GCCCAATGCC 
GCCCGGACAG ACTTTCACTG TGGCGACGAT AGCGGCAGTT TCGGTCATCT CGACGTCTGC 
CGCATGGCTG AACTCTGGCA CGACGTGTTC GAGGGGGTCG CCCAGCTCGC ACACGATCCT 
GCTTTGGGAC AGCCCGAGAT CCTGATGGTC GGCGACCACG GACCGCCATT GTGGTCGAAG 
CGCGGCCGCG CCCAATTCGA ACCCGGTAAG GTCGCGTGGT ACAGGCTGCA ACCGCGCAAG 
AGATCAGAGG CGCGGCTCGA GCGGGCGGGG AACAAGGCGA CGGCAACAAG CGTTGCGGTT 
ACGACGCGCG ACCGCTTGGA TTGA

Protein sequence

MPIPSIADYS TAIDGRLLAA RSARFVHANI RLIAGGLLIP NLLSLATMIS LIDIGLPPRT 
EAILFYACVA MLARRLPFVI IVPLFLTVLS FDIVRTLSLM FSVAPVEFLE AIDRAQRIQF 
FASPLYVALI VTIAATTVAA LVCLSRRSAL TNASAPAFFV LALGVAAIDF IGNVSPHYHF 
GATIGFEQPV QSAAEASGFK QTAGAEGRNV VLVMVESLGY LRDPAARQRI AAPLYDPALT 
RDYAVTSGQT VYYGSTTSGE MRELCDTRSF YKDFVQHDTD ACLPNLMARR GYSTVAVHGF 
SGGMFEREHW YPTIGFDRSL FGEKLLKATG RECGAAFRGV CDADFAPLIA AASRDADAGG 
KPRFIYWLTL TSHVPIAPNA ARTDFHCGDD SGSFGHLDVC RMAELWHDVF EGVAQLAHDP 
ALGQPEILMV GDHGPPLWSK RGRAQFEPGK VAWYRLQPRK RSEARLERAG NKATATSVAV 
TTRDRLD