Gene Rpal_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1039
Symbol
ID	6408695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	1103274
End bp	1104764
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	65%
IMG OID	642710954
Product	Integrase catalytic region
Protein accession	YP_001990071
Protein GI	192289466
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0651609
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAGACGG TCGCTCGGAT TCGGCGTGAG CATTTTCTCA AGGGCAAGAC GATCAAGGAG 
ATCGTCCGGG ACCTGAAGGT GTCGCGGAAC ACGGTCCGCA AAGTGCTGCG TTCCGGTGAG 
ACGTCATTCG AGTATGAGCG CGAAGTTCAG CCGCGACCGA AGCTTGGGCG GTGGACGGCC 
GAGCTGGATG AACTGCTCTC GACGAACGCC ACCAAGGCAG CTCGCGAGCA GTTGACGTTG 
ATCCGGATCT TCGAGGAACT GCGCGGGCGC GGTTATGACG GCGGCTACGA TGCCGTGCGC 
CGCTTCGCCC GGCGCTGGGC CAAGGAGCGC GGCCAGGCGA CGGCCGCAGC TTACGTACCG 
CTGAGCTTCG CGCCGGGAGA AGCCTACCAG TTCGACTGGA GCCACGAGAT CGTCCTGTTT 
GGCGGGGTGA CGACGATCGT GAAGGTCGCC CACGTCCGGC TCTGCCACAG CCGGATGTTG 
TTCGTGCGGG CCTATCCGCG CGAGACCCAG GAGATGGTGT TCGACGCTCA TGACCGGGCG 
TTCGCCTTGT TCAAGGGAAC CTGCGGACGC GGCATCTACG ACAACATGAA GACGGCGGTG 
GAGACGATCT TCGTCGGCAA GGACCGTCTC TATAATCGCC GCTTCATGCA GATGTGCAGC 
CACTACCTGA TCGAGCCGGT CGCATGCACG CCGGCGTCTG GCTGGGAGAA GGGTCAGGTC 
GAGAACCAGG TCGGCCTGGT GCGTGAGCGA TTCTTCACGC CGCGGCTGCG TTTCAGGAGC 
TACGACGAGT TGAACGCCTG GCTCACGGAC AAATGCATCG CCTACGCCAA AGCCCATCGC 
CACCCAGAGC TGACCGAGCA GACGATCTGG GAGGTGTTCG AAGCCGAGCG ACCAAAGCTC 
GTTCCCTATG CCGGCCGGTT CGATGGATTC CACGCGGTGC CGACCTCGGT CTCGAAGACC 
TGCCTGGTGC GCTTCGACAA CAACAAATAC TCGGTCGCCG CCAGCGCGGT CGGTCGACCG 
GTCGAGGTGC ATGCTTATGC CGACCGCATC GTCATCCGCC AGGACGGCCG CGTCGTTGCC 
GAACATCCTC GCTCGTTCGG TCGCGGCGAG ACCACCTACG ATCCCTGGCA TTACGTTCCC 
GTGCTGGCGC GCAAGCCGGG CGCCTTGCGC AACGGCGCGC CGTTCAAGGA TTGGGTGCTA 
CCGGCAGCGA TGGAACGCGT CAGGCGCAAG CTTGCCGGTG TTGCCGACGG CAACCGGCAG 
ATGGTCGATA TCCTCAATGC GGTGCTGACC GATGGCCTGG CGGCGGTCGA AGCCGCCTGT 
GTCGAGGCGA TCGCGCACGG CGTCCATTCC GCCGACGTCA TCCTCAACAT CCTCGCTCGC 
CGGCGCGATC CAGCGCCGCC GGCCAACATC CTCACCCCCG CGGCGCTGGC GCTGCGTTAC 
GCGCCCATCG CCGATTGTGC CCGCTACGAC AACCTCCGGA GGATGGTCTG A

Protein sequence

METVARIRRE HFLKGKTIKE IVRDLKVSRN TVRKVLRSGE TSFEYEREVQ PRPKLGRWTA 
ELDELLSTNA TKAAREQLTL IRIFEELRGR GYDGGYDAVR RFARRWAKER GQATAAAYVP 
LSFAPGEAYQ FDWSHEIVLF GGVTTIVKVA HVRLCHSRML FVRAYPRETQ EMVFDAHDRA 
FALFKGTCGR GIYDNMKTAV ETIFVGKDRL YNRRFMQMCS HYLIEPVACT PASGWEKGQV 
ENQVGLVRER FFTPRLRFRS YDELNAWLTD KCIAYAKAHR HPELTEQTIW EVFEAERPKL 
VPYAGRFDGF HAVPTSVSKT CLVRFDNNKY SVAASAVGRP VEVHAYADRI VIRQDGRVVA 
EHPRSFGRGE TTYDPWHYVP VLARKPGALR NGAPFKDWVL PAAMERVRRK LAGVADGNRQ 
MVDILNAVLT DGLAAVEAAC VEAIAHGVHS ADVILNILAR RRDPAPPANI LTPAALALRY 
APIADCARYD NLRRMV