Gene RPD_4398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4398
Symbol
ID	4024923
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4866604
End bp	4867692
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	67%
IMG OID	637964607
Product	hypothetical protein
Protein accession	YP_571515
Protein GI	91978856
COG category	[R] General function prediction only
COG ID	[COG5621] Predicted secreted hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.117298
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCTA GAGGCCTGAT CTCACGCCGC GCCTTCGCGG GCGGCTTGCT CGCGCTCGGG 
GCCAGTGGGC AACGCGTGCT GGCACAAGGA TTCGCAGGGC TCGGCAGCGA CGCGGGCGAA 
TTCGCGCCGG TCGTGCCCGG GCGGCGGCTT TCGTTTCCCG AGGACCACGG CCCGCATCCG 
GATTTCCGCA TCGAATGGTG GTACCTCACC GCAAATCTGA AAGACGCCGA CGGCAAGCCC 
TACGGCGTGC AGTGGACGCT GTTCCGTCAG GCGATGACGC CGGGCCCGCA GCGCGAGGGC 
TGGGCCAGTC AGCAGATCTG GATGGCGCAT GCGGCGCTCT CCAGCGCCGA GACGCATCGC 
TTCGCCGAAA AATTTTCGCG CGGCGGGATT GGGCAGGCCG GCGTTACGGC TGCGCCGTTC 
CGCGCCCTGA TCGACGACTG GGCGATGCAG GGCGGCGACG CGATGAAGGC TGCGACGTTG 
TCGCCGCTCG ACGTTACCGC ATCAGGCTCG GACTTCAGCT ATCGGCTGCA ATTGACCGCC 
GAGCGGCCGC TAGTGCTGCA AGGCGACGCC GGCTTTTCGC GTAAATCCGA CCGCGGCCAG 
GCTTCGTATT ACTATAGCCA GCCTTATTTT GCCGCGCGCG GGACGGTGAC GCTCGACGGC 
CGGGCGATCG AGGTCAGCGG CACAGCCTGG ATGGACCGCG AATGGTCGAG CCAACCGCTC 
GCTTCCGACC AGACCGGCTG GGACTGGTTC TCGCTGCATC TCGCCTCCGG CGAGAAGGTG 
ATGCTGTTCC GGCTGCGCCA GAGCGGCGGC CAAGCCTATT TCGCCGGCAA CTGGATCGGG 
CTCGACGGCA AATCCGAGCC GCTCGCGCCG GATGCGATCG CGCTCGAACC GATCGGCTTC 
ACCGAGACCG CCGGCCGCAG ACTGCCGACG CGCTGGCGCA TCAGCCTGCC CGGCCACGGT 
CTGTCGATCG AGACCACGCC GCTGAACCCC AACAGCTGGA TGGGGACCAG CTTCCCATAC 
TGGGAGGGAC CGATCTCGTT CAGCGGCAGC CAGGCCGGCA TCGGATATCT TGAGATGACC 
GGCTATTGA

Protein sequence

MSARGLISRR AFAGGLLALG ASGQRVLAQG FAGLGSDAGE FAPVVPGRRL SFPEDHGPHP 
DFRIEWWYLT ANLKDADGKP YGVQWTLFRQ AMTPGPQREG WASQQIWMAH AALSSAETHR 
FAEKFSRGGI GQAGVTAAPF RALIDDWAMQ GGDAMKAATL SPLDVTASGS DFSYRLQLTA 
ERPLVLQGDA GFSRKSDRGQ ASYYYSQPYF AARGTVTLDG RAIEVSGTAW MDREWSSQPL 
ASDQTGWDWF SLHLASGEKV MLFRLRQSGG QAYFAGNWIG LDGKSEPLAP DAIALEPIGF 
TETAGRRLPT RWRISLPGHG LSIETTPLNP NSWMGTSFPY WEGPISFSGS QAGIGYLEMT 
GY