Gene Sare_1650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1650
Symbol
ID	5703551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1898599
End bp	1899897
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	70%
IMG OID	641271156
Product	transposase IS4 family protein
Protein accession	YP_001536531
Protein GI	159037278
COG category	[L] Replication, recombination and repair
COG ID	[COG5659] FOG: Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.156297
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0326148
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCGCGT GCCACAGACT AGACCTTGAT CGGTGGCGGG TCATCCTGGA CGAGGCGGTG 
ACGCGTGTCG CTGACCGGTT CGTCCGGGCG GAGCCGCGTG CGACGGCGGG ACAGTTCGTG 
GAGGGGCTGC TGTCGGGGGT GGAACGTAAG ACCTGCTGGT CCCTGGCGGA GCGGGCTGGT 
CACGCCGACC CGCAGGCGAT GCAGCGGCTG CTGCGTACGG CGGTGTGGGA CGCCGACGCC 
GTCCGCGACG ATGTGCGGAA TTGGCTGGTC GAGCAGCTCG GCCACCCCGA CGGTGTGCTG 
GTCACCGACG AGACTGGCTT CCTCAAGAAG GGCGTGTGCT CGGTCGGGGT CCAGCGGCAG 
TACACCGGCA CCGCCGGACG TGTGGAGAAC AGCCAGGTCG GGGTGTTCCT GGCCTACGTG 
TCACCTGCCG GGCGGGCGTT GATCGACCGT CGGCTCTACC TGCCGGAGAC GACCTGGTGC 
GACCAGCCCG ACCGGCTCGC TGCCGCCGGC GTCCCAGACG ACGTCAGGTT CGCCACGAAA 
CCGGCCCTGG CCCGGCAGAT GATCGCCGCC GCGCTGGACG CCGGTGTGCC CGCCGGGTGG 
GTGACTGGCG ACGAGGTTTA CGGCGCCGAC CCCGGCCTGC GCGACGACCT CGAAGACCGC 
GGCATCGGCT ACGTCCTGGC CGTCGGCTGT GACCGACGGG TACACGTCAA CGACGGACGC 
ACCCTCGTAC GGGTCGATCA CCTCGCCGAG CGGATTCCCA CCGCCGAGTG GCAGTTGCAC 
AGTTGCGGGC CGGGGGCGAA AGGTCCCCGC GACTACCTGT GGGCCTGGAT CATCACCGCC 
ACCCGACCCG GTGAGCACCA GTGGCTGCTT ATTCGCCGCA ACCGCAGCAC CGGCGAGCTG 
GCCTTCTACC TGTGCTGGTC ACCTCGCCCG GTGCCGCTGC ACACCCTCGT GACCGTGGCC 
GGCTCCCGCT GGAGCATCGA GGAGTTGTTC CAGACCGGCA AAGGCCAGGT CGGCCTGGAC 
CACTACCAGG TCCGCGGCTG GACCGGCTGG CACCGCTTCC TCACCCTGGC CATGCTCGCC 
CTGGCCGTCC TGACCATCCT CGCCGCCACC ACCGCCCAGC AGACCGACGC CGACCCGGAG 
ATCATCGCGT TGACCGTCGC CGAGATCCGG CGACTCCTCA ACGCCCTCGT TCTGGCCCTG 
CCCCTACCAG CAGCGCACAC CCTGCACTGG TCGATCTGGA GACGAACATC CCAAGCCCGA 
GCCCGCCGAT CCCACTACCA GCGCAGACAG GCGAAGTGA

Protein sequence

MAACHRLDLD RWRVILDEAV TRVADRFVRA EPRATAGQFV EGLLSGVERK TCWSLAERAG 
HADPQAMQRL LRTAVWDADA VRDDVRNWLV EQLGHPDGVL VTDETGFLKK GVCSVGVQRQ 
YTGTAGRVEN SQVGVFLAYV SPAGRALIDR RLYLPETTWC DQPDRLAAAG VPDDVRFATK 
PALARQMIAA ALDAGVPAGW VTGDEVYGAD PGLRDDLEDR GIGYVLAVGC DRRVHVNDGR 
TLVRVDHLAE RIPTAEWQLH SCGPGAKGPR DYLWAWIITA TRPGEHQWLL IRRNRSTGEL 
AFYLCWSPRP VPLHTLVTVA GSRWSIEELF QTGKGQVGLD HYQVRGWTGW HRFLTLAMLA 
LAVLTILAAT TAQQTDADPE IIALTVAEIR RLLNALVLAL PLPAAHTLHW SIWRRTSQAR 
ARRSHYQRRQ AK