Gene Rpal_1095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1095
Symbol
ID	6408751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	1160849
End bp	1161877
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	57%
IMG OID	642711001
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_001990118
Protein GI	192289513
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCATT ACGTCGGTTT GGATGTCTCG CAAAGAGAAA CTGCGGTGTG TGTGGTCAGC 
GAGATCGGGC AATTAGTCTT CGAGGGAAAG GCCAAGTCAG ATCCCGGCGC TCTGACCAAC 
CTGCTTCACA AACATGCTCC GCTTGCGGAG CGCATTGGCT TTGAGACTGG CGCGATGGCA 
AGCTGGCTTT GGCACGAGCT TCGTAGAGTC GAACTCCCTG TCGTTTGCAT CGATGCGCGA 
CATGCAAACG CGGCCCTGTC GGTCCGTATG AACAAGAGCG ATCAAAATGA CGCTCGAGGC 
CTAGCCGAAC TAGTGCGGGT CGGTTGGTAT CGAGAAGTCA AAGTTAAGAG CGAGAAAAGT 
CAGAAGATCC GCGCGATGCT TGTAGCACGA TCCCGACTCG TATCGATGCG CCGGGACATT 
GAGAACCAGG TCCGTAGTCT GATCAAAGAA TGTGGATTAC TATTCCCTCG CGCCATCGGC 
CAACAGTTCC GCAATCGGGT CAGCGAGCTA TTGGGCGAGG ACCATCAGCT TGTCAGCGTG 
GTCGCGCCGC TGCTGTCGAT TCATGAGCAC ATCTGTCTGC AGCAAGGCAA GTTCGACGAC 
GAGGTTCGCC GATTGGCGAA GTCGGACGAA ACGACGCGAC GCCTGATGAC GGTTCCTGGC 
GTCGGAGTAG TGACCGCCCT GACTTTCCGC CATACGATCG ATGACCCATC CCGCTTCCGG 
TCGGCCTCGA CAGTCGGCGC CTATCTCGGT CTTACACCTC GGCGCAACCA ATCTGGGGAA 
ACCGACACCA GTGGCAAGAT ATCTCGATGG GGCGATCGGC TGCTCCGAAC GTACCTGTTC 
GAGGCGGCGA CCGTGCTGCT CTATCGGACT AAGAAATGGT CCTCCCTCAA GGCCTGGGGA 
GTGAAGCTCG CGAAACGGAT AGGTATGAAG AAGGCGAAAG TCGCCATCGC CCGCAAGATC 
GCCGTGATTC TTCACTGCAT CTGGGTCGAT GGCACATCGT TCGAGTGGGG TCAGGCAACG 
CCGGCCTGA

Protein sequence

MKHYVGLDVS QRETAVCVVS EIGQLVFEGK AKSDPGALTN LLHKHAPLAE RIGFETGAMA 
SWLWHELRRV ELPVVCIDAR HANAALSVRM NKSDQNDARG LAELVRVGWY REVKVKSEKS 
QKIRAMLVAR SRLVSMRRDI ENQVRSLIKE CGLLFPRAIG QQFRNRVSEL LGEDHQLVSV 
VAPLLSIHEH ICLQQGKFDD EVRRLAKSDE TTRRLMTVPG VGVVTALTFR HTIDDPSRFR 
SASTVGAYLG LTPRRNQSGE TDTSGKISRW GDRLLRTYLF EAATVLLYRT KKWSSLKAWG 
VKLAKRIGMK KAKVAIARKI AVILHCIWVD GTSFEWGQAT PA