Gene RPD_3934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3934
Symbol
ID	4024450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4373401
End bp	4374600
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	64%
IMG OID	637964138
Product	transposase, IS204/IS1001/IS1096/IS1165
Protein accession	YP_571056
Protein GI	91978397
COG category	[L] Replication, recombination and repair
COG ID	[COG3464] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGAG CCCTACGTCC ATCGGCGCTG ATCCCTCGTG GGTTTGATGT CGAGAGCGCC 
ATCTGCGACG GCACCACGAC CGTGATCACC GTTCGCTCCA CCAGCGACAC GAGTCGCTGC 
CCGGGGTGTG GAGAAAGCTC GAGACGAATC CACAGCCGAT ATCGCCGATG CATTGCGGAT 
TTGCCGCTGG CAGGGCGGAG GGTTCGGCTT GTGGTCGCGG CGCGGCGATT TCGCTGCGAT 
GCAGTTCTGT GCGGCCGACG TGTCTTCACG GAACGCTTCG TTGACGGCGT CCTGGCGCCC 
TGGGCGCGAC GAACAGCTCG ACTCGACTAT GTCGTCCATC AGCTTGGCCT GGCATTGGGC 
GGGCGCCCGG CGGCAACTAT CGCCCGCCGA CTTATGCTGC CCGTGAGCAA TGATACCTTG 
CTCCGTGTCG TTCGGAGGCG CGGCTGCCCA CTGTTTCCTG CACCAAGCGT TGTCGGTATT 
GACGATTGGG CCTGGCGCCG CAATCAGCGA TACGGAACGA TCATTTGCGA CCTTGAACGC 
CGGCGGCCGA TCACCCTCCT TCCGGACAGG GAGGCCGCCA CCGCCCAAGC CTGGCTCGCA 
GGGCAGCCGC AGATCGCTGT GGTCGCACGC GACCGCGGCG GCAGCTACGC TCTTGCCGCG 
GCCAAGGCGC TACCACACGC CACCCAGGTC GCCGATCGCT GGCATCTCAT GGAGAATGCC 
AGCCACGCGT TTCTCGATGC GGTTCGCAAA TCCATGCGAC AGATTCGCGC CGCGGTCGGC 
GCCGCCACGA TCAATCCGGG CCTGCTCACC GCCGCCGAGC GCCTCCAATA CGAAGGCTTT 
CTCCGGCGGG AGGACGCCAA TGCGGCAATC CTCAAGCTGG TCGCGACGGG CACCTCCATC 
AAAGAGATCG TACGGCTCAG CGGACATAGC CGGGGCCTGG TCCGTCGCAT TCTTCGGGGG 
CAACGAACCG ATGTGTTCCG AATTCGCGAA AGCTCCCTCG AACCTCATCT GCAATGGCTT 
GATGCGCAAT GGCTTGCGGG TCATCGCAAT GGTGCCGAAC TATGGCGCCG CCTCAAGAGC 
CTGGGATTCA GAGGCTCACT GCGGGTCGTT GCAGAATGGG CGACACATCG CCGGCGTGTA 
GAAACGGTCG ATGACCAGGC GCTACATCGG GTGCCGTCGG CCAGAACCAT CGCCGGCTGA

Protein sequence

MQRALRPSAL IPRGFDVESA ICDGTTTVIT VRSTSDTSRC PGCGESSRRI HSRYRRCIAD 
LPLAGRRVRL VVAARRFRCD AVLCGRRVFT ERFVDGVLAP WARRTARLDY VVHQLGLALG 
GRPAATIARR LMLPVSNDTL LRVVRRRGCP LFPAPSVVGI DDWAWRRNQR YGTIICDLER 
RRPITLLPDR EAATAQAWLA GQPQIAVVAR DRGGSYALAA AKALPHATQV ADRWHLMENA 
SHAFLDAVRK SMRQIRAAVG AATINPGLLT AAERLQYEGF LRREDANAAI LKLVATGTSI 
KEIVRLSGHS RGLVRRILRG QRTDVFRIRE SSLEPHLQWL DAQWLAGHRN GAELWRRLKS 
LGFRGSLRVV AEWATHRRRV ETVDDQALHR VPSARTIAG