Gene Strop_4134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_4134
Symbol
ID	5060618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	4699603
End bp	4702689
Gene Length	3087 bp
Protein Length	1028 aa
Translation table	11
GC content	68%
IMG OID	640476396
Product	transposase Tn3 family protein
Protein accession	YP_001160941
Protein GI	145596644
COG category	[L] Replication, recombination and repair
COG ID	[COG4644] Transposase and inactivated derivatives, TnpA family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.160281
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGTCGA TCGAGCGGAC CGCGTATCCG CGGTTCAAGC GGTTTCTGTC GGCCCGGGAA 
TTGCACGTGT TCTACACGCC GCAGCCGGAG GAGATCGCGT GGACGAGCGG GCTGGTGCGC 
TCGGACAGTC ATCTGCTGGC GTTCATGGTG CAGCTGAAGT GCTTCAACCG GATGGGGTAC 
TTCCCGCGGC TGGATGAGGT CCCGGAGGCG GTGGTGGCCC ACATCCGGCG GGATCTGGGC 
CTGGGTGAGG ACGTCGCCGC GGTGTACGAC TCGGAGCGGA CCTGGGGCCG TCATCGGCTG 
CTGATCCGCC GACGTAGTGA AGTCGTGTCG GACATGCCGG CGGCCCGGGC GGTGGCCGCC 
GCGGCGATCC GGGAGGCTGC CGGGCGTAAG AACGATCCGG CCGACCTGAT CAATGTGGCG 
TTGGAGAAGC TGGTCGAGGG CTCGTTCGAG CTGCCGGGTT ACACGACGTT GGACGAGATG 
GCCTCGGCGA TCCGCGAGGA GGTCAACTCG GCGATCTTCG CGCTGGTCGT CGAGCGCATC 
GGTCCGGCAG GTGTGGCCGG GTTGGATCGG ATGCTGATTA CGGCGGGTGG TCCGGGGAGC 
AAGAGCGACT ACAACCGGTT GAAGCGGACC GCGCCGCGGC CGTCGTGGAC GAACTACCGG 
CTGCAGATCG AGCATCTGCG CTGGGCCGAC AGTCTTGGTG ACTCGCGGTC CTGGTGGGAG 
GGCATCGCGC GATCGAAGAT CGCCGACTTT GCCGGGGAGG GCGAGGCCGG TGACGCCGCG 
GTGCTGGGCG ACTACGGGGA CGCGAAGCGT ATCGCGATCC TGGCGGCGAT GGTTTACGCC 
GCGCAGCAGC GGGCCCGCGA CGACACAGCG GAGATGTTCT GCCGGCGGGT CGGCACCCTG 
ACCAAGCGGG CCCGGCTGGA GCTGGAGGAG CTGAAGAAGA AGCAGCAGAA GGTCACCGAG 
GCGCTGATCG TCAACTACCG GCAGGTCCTG GAGCACCTCG ACCCGTACGG TCCGGCCGCG 
GCCCAGCACG CCGCGACGCT GGAGATGGCC CGCAAGACAG TCGAGGCCGC GGGCGGTTTC 
CCGGAGGAGC TGGCCCGCAT CGATGCGGTC CGGGCGACCC ACGGCGACAA CCATGTGCCG 
CTGGTGGCCC GGCATTTCCG CAAGGACCGG TCGTCGATGC TGGCCATGGT GGGCGTCCTG 
GACTTGGAGG CGACCAGCGC GGACCGCAGT GTGTTGCAGC TGCTGGACTA CATGCGTGAG 
CACACGATGC TGACCCGCGA TCACATCCCT GACCGGATCT CGGTGTTAGA CGAGCAGGGC 
CGGCCGGTGA CCTACCCAGA GACGGGTGAG CAGCGGATCC ACGTGTTTGA CACGTCGTTC 
GCGTCGGAGA ACTGGAACAG GTCGATCCGG GACCGCAGCC GGCCCGGCAT GTTCGTACGC 
CGGCACTTGG AGGCGTGCGT GCTGACGTAT CTGGCCGAGG AACTGCGGAC CGGCGACATC 
GCTGTGACCG GCGCGCAGGC GTACGCGAAC TGGGCTGATC AGCTGCTGTC CCCGGACGAA 
GTCGCCGCGA TGCTGCCGGG CTTCTGTGCC GAGGTCGGTA TCCCGGCGAC AGCCGCCGGG 
TTCCGCGCGG ACCTGCACGA GCGCCTCGAC GCGCAGTGCC GGGCAACCGA CAGCGCGTAT 
CCGGACCTGG CCGACTTCAC CATCGACGAG CTCGGCCGTC CATCGCTCAA GCAGCTGCGA 
GCGGCGCCGC CCACACCGTC GGCGCAGGCC ATCGCGCTCG CCGTGCGGGA CCGGATGCCG 
GAGCGCACGC TGATGGGGAT CCTGGCCCGC ACCGGGCACT GGCTGGACTG GTGGCGCCGG 
TTCTCGCCCG TGTCGGGTTC GGATCCGAAG CTCAAAGACC CGTTCGTGCG CTACATCCTG 
ACCACGTTCA CGTACGGCAC GAACCTGGGG CCGGCGCAGG CCGCCCGGCA CATCGCCGGG 
GTCAGCGCCC ACGAGCTGGC CACCACGTCG GCGCGGCACG TCACGATCGG CAAGCTGAAC 
AAGGCCATCG CCGACGTCGT CGATGCGTTC ACCGAGCTGG ACCTAATCAA GGTGTGGGGC 
GACGGATCGG TGGTCGCCGC GGACGGTACC CAGGTGGACA CGTTCATCGA CAACCTCCTG 
GCGGAGACGT CGATCCGGTA CGGCGGCACC GGCGGGATCG CGTACCACTA CGTGTCGGAC 
ACCTACATCG CGTTGTTCTC CAAGTTCATC CCGGTCGGGG TGTGGGAGGC CGTGCACATC 
ATCCAGGGCC TGCTCGACCA GCAGTCCAAG GTGCGGCCGG GCACGATCCA CGCCGACACC 
CAGGGCCAGG CGCTGCCCGT CTACGCGCTC GCGCATTTGT GCGGGTTCGA GCTGATGCCG 
CGGGTGCGTA ACTGGAAGGA TCTCAACTTC TACCGCACGT CGGCGGCCAC CCGGTTCCGG 
CACATCGAGG CCCTGTTCGG CGAGCCCGGC CGCAACGTCA TCGACTGGGA CCTGATCGAA 
CGCCACTACG ACGACCTGAT GCGGATCGTG CTTTCCGTCG CGGCCGGGAA GATCTCATCC 
GTGACGTTGC TGCGCCGGCT GTCGACCTAC TCCCGGCGCA ACAACTTCTA CAAGGCCTTC 
CGCGAGGTCG GCCGGGTCAT CCGCACGATC CAGCTACTGC GCTACCTGTC GGACCCGCAG 
CTACGCCGGC GGACCACCGC GGCGACCAAC AAGGTCGAGT CCTACAACAA CTTCTCCGCC 
TGGTGCCGAT TCGGCAACGA GGGCCGCGTC CGCGACAACG ACCCCGCCGA GCAGGAGAAA 
CACATCAAGT TCTCCACCCT GCTGACCAAC GCGGTCATCT TTCACACCAC CCTGGACATG 
ATGAGCGTGC TCCGGCAACT CGCCGGTGAG GGCTGGGAGA TCAAACCGGA GGACCTGGCC 
GTGCTGTCGC CGTACCAGAC GATGCGGATC AACCGGTTCG GCGTCTACGC CACCGACGAG 
ATCACCATCA CCCCCGAGCA GTACGACGCG CACCTACCCG ACATCGACCT CACCATCCCG 
GAGCCCGTAC CGTCACCCGC CCGGTGA

Protein sequence

MTSIERTAYP RFKRFLSARE LHVFYTPQPE EIAWTSGLVR SDSHLLAFMV QLKCFNRMGY 
FPRLDEVPEA VVAHIRRDLG LGEDVAAVYD SERTWGRHRL LIRRRSEVVS DMPAARAVAA 
AAIREAAGRK NDPADLINVA LEKLVEGSFE LPGYTTLDEM ASAIREEVNS AIFALVVERI 
GPAGVAGLDR MLITAGGPGS KSDYNRLKRT APRPSWTNYR LQIEHLRWAD SLGDSRSWWE 
GIARSKIADF AGEGEAGDAA VLGDYGDAKR IAILAAMVYA AQQRARDDTA EMFCRRVGTL 
TKRARLELEE LKKKQQKVTE ALIVNYRQVL EHLDPYGPAA AQHAATLEMA RKTVEAAGGF 
PEELARIDAV RATHGDNHVP LVARHFRKDR SSMLAMVGVL DLEATSADRS VLQLLDYMRE 
HTMLTRDHIP DRISVLDEQG RPVTYPETGE QRIHVFDTSF ASENWNRSIR DRSRPGMFVR 
RHLEACVLTY LAEELRTGDI AVTGAQAYAN WADQLLSPDE VAAMLPGFCA EVGIPATAAG 
FRADLHERLD AQCRATDSAY PDLADFTIDE LGRPSLKQLR AAPPTPSAQA IALAVRDRMP 
ERTLMGILAR TGHWLDWWRR FSPVSGSDPK LKDPFVRYIL TTFTYGTNLG PAQAARHIAG 
VSAHELATTS ARHVTIGKLN KAIADVVDAF TELDLIKVWG DGSVVAADGT QVDTFIDNLL 
AETSIRYGGT GGIAYHYVSD TYIALFSKFI PVGVWEAVHI IQGLLDQQSK VRPGTIHADT 
QGQALPVYAL AHLCGFELMP RVRNWKDLNF YRTSAATRFR HIEALFGEPG RNVIDWDLIE 
RHYDDLMRIV LSVAAGKISS VTLLRRLSTY SRRNNFYKAF REVGRVIRTI QLLRYLSDPQ 
LRRRTTAATN KVESYNNFSA WCRFGNEGRV RDNDPAEQEK HIKFSTLLTN AVIFHTTLDM 
MSVLRQLAGE GWEIKPEDLA VLSPYQTMRI NRFGVYATDE ITITPEQYDA HLPDIDLTIP 
EPVPSPAR