Gene RPB_3306 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3306
Symbol
ID	3911107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	3780879
End bp	3782231
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	59%
IMG OID	637885208
Product	Phage integrase
Protein accession	YP_486913
Protein GI	86750417
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.889733
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.962231
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATCAC AACCCGCGCC CCTAACGCCA TTTGCGATCG CCAACGCCAA GCCCAAGCCG 
ACCCGGTATG AGATCAGCGA CGGCGGACAC GCCGGCCTGC GCGTTATCGT GCAGCCGTCT 
GGCATCAAGT CGTTCGTGTT CCGATACAAA CGAGGGACGG GGGAAGCTGC GAAAAATGTG 
CGGATTATGT TGGGTCGCGC AGCCGGTCCC GGCGCGCTCA CCTTGCGGCA GGCACGCGAA 
GCGGCCGACT CCCACCGCCG GCTCAAGCTG ACGGGGGCGG ACCCTGCCGA CCAGCGCAGA 
GTGGAACGGG CCGCAAATCT TGCGCGAATC AGGGCCGAAG AGATCGAAAA TCGCCGGAAA 
GACGACACCG TTGCGCTCGT CTTGGAACGC TACTTCAAGA GTCATGTTAA CGGCCTTCTC 
TCTGCTCGGG AGACGAAACG TATTTTGACG CGCGAACTAA GCGGTTGGGC ACGGCGGCGG 
ATCGATCATG TTTCGCGTGC CGATGCCGTC AAATTACTTG AAGCAATCCA AGAGCGAGAC 
AAACCCATCC TCGCGAACCG GACCCGCGCG CACGCAAGTA AGTTCTTCAA GTGGTGTATT 
GAGAAGGGGT TGCTTGAGAT CAATCCATTC GAACACACCA CGCGGGCAGC CAAGGAAATC 
GCTCGTGATC GCGTCTTGAG CGATGCCGAG CTGCGCATTT TGTTGCTTGC GAACGACCGC 
CTTGAATGGC CATGGCGAGA GTACATTGCG GTTCTGCTCA TGCTCGGCCA GCGCCGCGAG 
GAGGTTGCCG GGATGCGCTG GGACGCGCTG GACCTTGATT GTGCCGAACC GGTGTGGCTG 
ATGGCCGCGT CGCGATACAA GAACGGCCAA CCTCACGCCG TTCCCCTCCC CGCCGCTGTC 
GTCTCGATCC TCCGCAGCAT CGGTCGGATG CACTTCACTG AGATCATTGA CGGTGCGCCG 
ACGCTCAAGG AGTCGCCGTT CGTTTTCACG ACGACGGGCC GCACCGCAAT TAGCGGCTTC 
TCGAAAGCGA AAGTTCAACT CACCGGAATC ATGCACGAAA TAGCTTGTGG TGAAGCGAAG 
GCCCGGGGCG AATCCACCGC TACCATTGAA AAGATCGAAT GGCGTCTGCA CGACCTGCGG 
CGCACAATGG CAACGACCAT GGCACGCCTA AAAATTAACG TTGTAACGAT TGAACGCGTC 
TTGGGGCACA AGATGCAAGG TGTCATGGCC GTCTATCAGC GGTACGACTA CCTACCCGAA 
AAGCTCCACG CACTCACCGT TTGGAATGAC CATATTGCGA GGATAGTAGC TCCTCAGCAA 
TCGAATGTCG TTCGCATGAC CGTCGCAGGC TGA

Protein sequence

MPSQPAPLTP FAIANAKPKP TRYEISDGGH AGLRVIVQPS GIKSFVFRYK RGTGEAAKNV 
RIMLGRAAGP GALTLRQARE AADSHRRLKL TGADPADQRR VERAANLARI RAEEIENRRK 
DDTVALVLER YFKSHVNGLL SARETKRILT RELSGWARRR IDHVSRADAV KLLEAIQERD 
KPILANRTRA HASKFFKWCI EKGLLEINPF EHTTRAAKEI ARDRVLSDAE LRILLLANDR 
LEWPWREYIA VLLMLGQRRE EVAGMRWDAL DLDCAEPVWL MAASRYKNGQ PHAVPLPAAV 
VSILRSIGRM HFTEIIDGAP TLKESPFVFT TTGRTAISGF SKAKVQLTGI MHEIACGEAK 
ARGESTATIE KIEWRLHDLR RTMATTMARL KINVVTIERV LGHKMQGVMA VYQRYDYLPE 
KLHALTVWND HIARIVAPQQ SNVVRMTVAG