Gene RPC_0078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_0078
Symbol
ID	3971335
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	86951
End bp	87991
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	67%
IMG OID	637923194
Product	hypothetical protein
Protein accession	YP_529976
Protein GI	90421606
COG category	[R] General function prediction only
COG ID	[COG5621] Predicted secreted hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCTGC TGGCGCTCGG CGGCAATGCA CGCGCGCAAG GCTTTGCCGG GCTCGGCCGC 
GACGCCGGCG AATTTGCGCC TGTGCTGCCG GGACGCCAAC TGAGCTTTCC GCTCGATCAT 
GGCGCGCATG CGGAGTTTCG CATCGAGTGG TGGTACCTCA CCGCGAATTT GCAGGACGCA 
GCAGGCCAAG CCTATGGCGT GCAGTGGACC TTGTTCCGGC AGGCGATGCG GCCGGGCGCG 
CAGCAGGAGG GCTGGGCCAA TCAGCAGATC TGGATGGCGC ATGCCGCCCT GACCCGCGCT 
GATACGCACC GCAGCGCCGA GCGCTTTGCC CGCGGCGGCA TCGGCCAGGC CGGCGTCACC 
GCCACGCCGT TCCGCGCCTG GATCGACAAT TGGCAGATGC AAGGCGGGGA GGCGATGGCG 
CCGGCGACAC TGTCGCCGCT CGACCTCACC GCATCGGGCG CGGATTTCAG CTACGCGCTG 
CGGCTCGCCG CGCCACAGCC CTTGGTGCTG CAGGGCGACA ACGGCTACAG CAAGAAATCC 
GAGCGCGGCC AGGCGTCGTA TTACTACAGC CAACCGTATT TTGCAGCGAC CGGCAGCATC 
ACGCTCGACG GCAACGCGGT CGAAGTCAAC GGCCAAGCGT GGATGGACCG CGAATGGTCG 
AGCCAGCCGC TGGCCTCCGA CCAGACCGGC TGGGACTGGT TCTCGCTGCA TCTCGACAGC 
GGCGACAAGG TGATGCTGTT CCGGCTGCGG CAGAGCGACG GCGCGAATTA TTTCGCCGGC 
AACTGGATCG GCACCGACGG CCAATCGGTG CAGCTTGCGC CCGACGCGAT CGCCATTACC 
CCGACCGGCT TGACGCAGAT CGGCAAGCGC CAACTGCCGA CCTCGTGGCG GATCGCGATC 
GCGCCGCGCG GGCTTGCGAT CGACACCACG CCGCTGAACG CGCAGAGCTG GATGGGCACC 
AGCTTTCCCT ATTGGGAGGG GCCGATCGCG CTCCGCGGCA GTCACGCCGG CGTCGGTTAT 
CTTGAGATGA CGGGCTATTG A

Protein sequence

MALLALGGNA RAQGFAGLGR DAGEFAPVLP GRQLSFPLDH GAHAEFRIEW WYLTANLQDA 
AGQAYGVQWT LFRQAMRPGA QQEGWANQQI WMAHAALTRA DTHRSAERFA RGGIGQAGVT 
ATPFRAWIDN WQMQGGEAMA PATLSPLDLT ASGADFSYAL RLAAPQPLVL QGDNGYSKKS 
ERGQASYYYS QPYFAATGSI TLDGNAVEVN GQAWMDREWS SQPLASDQTG WDWFSLHLDS 
GDKVMLFRLR QSDGANYFAG NWIGTDGQSV QLAPDAIAIT PTGLTQIGKR QLPTSWRIAI 
APRGLAIDTT PLNAQSWMGT SFPYWEGPIA LRGSHAGVGY LEMTGY