Gene Sare_3160 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3160
Symbol
ID	5706109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3647300
End bp	3648526
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	70%
IMG OID	641272592
Product	integrase catalytic region
Protein accession	YP_001537959
Protein GI	159038706
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00012152
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCTGAGCG TGGAGGACTG GGCGGAGATC CGTCGGTTGC ACCGGGCGGA GCGGATGGCG 
ATCAAGGCCA TCTGTCGTCG GCTGGGGGTC TCGCGGAACA CGGTGCGTAA GGCCTTGGCC 
AGTCATGAGC CGCCCCGCTA TCAGCGGGCG GCGAAGGGCT CGATCGTGGA TGCGGTCGAG 
CCGCAGATCA GGGTGTTGTT GGCGGAGTTC CCGGACATGC CGACGACGGT GATTATGGAG 
CGGGTCGGGT GGACCCGCGG CAAGACGGTG TTCGCCGATC GGGTGCAGCA GTTGCGGCCG 
TTGTTCCGTC GGCCCGACCC GAGCCAGCGG ACGGAGTATC TGCCGGGTGA GTTGGCGCAG 
TGTGATCTGT GGTTCCCGCC GGCGGACGTG CCGTTGGGGT TCGGGCAGGT CGGTCGGCCG 
CCGGTGCTGG TGATGGTGTC GGGGTATTCG CGGTGGCTGT CGGCGGTGAT GATCCCGTCG 
CGGCAGTCAC CGGATCTGCT GGTCGGGCAC TGGAGGCTGA TCTCCGGCTG GAGGCGGGTG 
CCCAAGGCGT TGGTGTGGGA CAACGAGTCC GCGGTTGGGC AGTGGCGGGC CGGGCGGCCG 
CAGCTGACCG AGGCGATGAA CGCCTTCCGC GGCACTCTCG GCATCAAGGT GATTCAGTGT 
CGGCCGGCAG ACCCGGAGGC CAAGGGCCTG GTCGAGCGGG CCAACGGCTA TCTGGAAACC 
TCGTTCCTGC CCGGACGCCG CTTCGCCTCA CCCGGCGACT TCAATGCCCA GCTGTCCGAG 
TGGTTGGTGC GGGCGAACAA CCGGCAGCAC CGGGTACTGG GCTGCCGGCC AGCCGAACGA 
TGGGACGCCG ACCGGCAAGC GATGCTGCCG CTGCCGCCGG TCGCACCGGT GGTCGGCTGG 
CGGCAGGCCA CCCGACTGCC CCGCGATCAC TACGTGCGCA TGGACGGCAA CGACTACTCG 
GTGCACCCGT CGGTGGTTGG CCGGCGGGTC GAGGTCACCG CCGACGGCGA CCAGGTGACG 
GTGCTCTGCG ACGGCCGATC CGTGGCCCGA CACGATCGCT GCTGGGCGAA GCACCAGAGC 
ATCACCGACA CCGCCCACCG GCAAGCCGCC GCTGATCTGC GCGTCGCTGC CCAACGCACG 
CCCACGGCCG CCGTTGACGC CCAGGTCGAA CGGCGTCCGT TGAGCGACTA CGACCGCCTG 
TTCGGCCTGG ATGAGGTGGC TGCGTGA

Protein sequence

MLSVEDWAEI RRLHRAERMA IKAICRRLGV SRNTVRKALA SHEPPRYQRA AKGSIVDAVE 
PQIRVLLAEF PDMPTTVIME RVGWTRGKTV FADRVQQLRP LFRRPDPSQR TEYLPGELAQ 
CDLWFPPADV PLGFGQVGRP PVLVMVSGYS RWLSAVMIPS RQSPDLLVGH WRLISGWRRV 
PKALVWDNES AVGQWRAGRP QLTEAMNAFR GTLGIKVIQC RPADPEAKGL VERANGYLET 
SFLPGRRFAS PGDFNAQLSE WLVRANNRQH RVLGCRPAER WDADRQAMLP LPPVAPVVGW 
RQATRLPRDH YVRMDGNDYS VHPSVVGRRV EVTADGDQVT VLCDGRSVAR HDRCWAKHQS 
ITDTAHRQAA ADLRVAAQRT PTAAVDAQVE RRPLSDYDRL FGLDEVAA