Gene RPD_3936 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3936
Symbol
ID	4024452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4375060
End bp	4376091
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	61%
IMG OID	637964140
Product	transposase IS116/IS110/IS902
Protein accession	YP_571058
Protein GI	91978399
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGAAGA TTACCACAAT CGGACTAGAC TTGGCCAAGT CCGTCTTTCA GGTTCACGCA 
GTTGCCGAAG ACGGTCGCGT CATGGTTCGT CGCGCGCTGC GGCGGTCGCA GTTATTGGAC 
TTTTTTCGAT CGCTGGAACC GTGCCTCGTT GGCCTGGAGG CTTGCGCAAG TTCGCACTTT 
TGGGCCAACG CTATTGGGCA ACTCGGTCAT ACAGTTAGGA TGATGCCGCC GGCCTACGTG 
AAGGCCTATG TCAAACGCAA CAAAACAGAC GCCGCCGATG CCGAGGCGAT CTGTGAGGCG 
GTGACGCGAC CGACTATGCG CTTCGTGCCG ATCAAATCGC CGGAAGAGCA GGCGGCGGGA 
ATGGTCCTGA AGACACGGGA GCTGTTTGTG CGTCAGCGGA GCCAGACGGC GAACGCGATG 
CGCGCTCACA TGGCCGAGTT GGGCATCGTA GCCGCAACCG GAATGACCAG CATCGCCAAA 
CTCGTCGCCA TTCTCCGTGG CGGTGACGAT GACCGCCTTC CATCTGCAGC TCGAGCAGCC 
CTCCTGGAGA TGGCCGAGCA GATCGAGAGA CTGACGGCCC GTATCGAAGC GCTCGACACG 
AAAATCATGG CGGCGGTGAA GAATGACGAA GCCGCTCGAC GGCTCACCAC CATCCCCGGC 
GTCGGTCCGA TCATCGCCGC GACGGTCCGG GCAACGATCC AGGATCCAGC AGCCTTCCGA 
ACGGGACGCG ATCTGGCGGC TTGGATCGGG ATTACACCGA GGGCCAACTC CAGCGGCGGC 
AAAGAGCGGC TCGGCCGAAT ATCGAAGCAA GGCAACAAGC AGTTGCGAAC GCTGCTCATC 
GTCGGCGCGA CGTCGATTCT GAAGCAGGCA AGTCGTGGCG TGAATCTGCC CGCCTGGGTG 
TTATCCTTGA TGGTGCGTCG GCCCTACAAG GTTGCAGCCG TGGCGCTGGC CAACAAGATG 
GCGCGCACGA TCTGGGCGCT TCTCGTCAAG GGCGGAACTT ACCAGGCGCC AGCAATCATG 
GCGCGAGCAT AG

Protein sequence

MEKITTIGLD LAKSVFQVHA VAEDGRVMVR RALRRSQLLD FFRSLEPCLV GLEACASSHF 
WANAIGQLGH TVRMMPPAYV KAYVKRNKTD AADAEAICEA VTRPTMRFVP IKSPEEQAAG 
MVLKTRELFV RQRSQTANAM RAHMAELGIV AATGMTSIAK LVAILRGGDD DRLPSAARAA 
LLEMAEQIER LTARIEALDT KIMAAVKNDE AARRLTTIPG VGPIIAATVR ATIQDPAAFR 
TGRDLAAWIG ITPRANSSGG KERLGRISKQ GNKQLRTLLI VGATSILKQA SRGVNLPAWV 
LSLMVRRPYK VAAVALANKM ARTIWALLVK GGTYQAPAIM ARA