Gene Sare_3107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3107
Symbol
ID	5706546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3531373
End bp	3532461
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	65%
IMG OID	641272540
Product	putative transposase
Protein accession	YP_001537908
Protein GI	159038655
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0260258
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGGTC GTCCGCGTGG TGTGGTGGAA CTGACTGATG ACGAGCGTGC GTGTCTGAGC 
CGGTGGGCGC GGCGGGGTAA GTCGTCGCAG GCGTTGGCGT TGCGGTCGAA GATCGTGTTG 
TTGTGCGCCG ATGGCCTGGT GAACACGCAT GTCGCGCTGC GGCTTGGGGT GTCGCGGGAC 
ATGGTGGGTA AGTGGCGTAG CCGGTTCCTG GCGCGTCGGT TGGAGGGCCT TGTTGACGAG 
CCTCGGCCGG GGGCGCCTCG TCGGATCAGC GACGACCGGG TCGAGGAGGT GATCGTGAAG 
ACCCTCGAAC GGCAGCCGGC CAATCGGGAC AGTCACTGGT CGACCCGGTC GATGGCGCGC 
GAGACCGGGT TGTCACAGAC GGCGGTGTCG CGGATCTGGC GGGCGTTCGG TCTCAAACCG 
CATCTGGTGG ACACCTGGAA GTTGTCGGCT GACCCGATGT TCGTGGAGAA AGTCCGTGAC 
GTGGTGGGTC TGTACCTGGA TCCGCCGGTC AAGGCGATGG TGCTGTGCGT TGATGAGAAG 
TCGCAGATGC AGGCCTTGGA GCGGACCCGC CCGATGCTGC CGATGATGCC CACGGTCCCG 
GCGAGGCAGA CCCATGACTA CGTCCGTCAC GGCGTGGCCA GCCTGTTCGC CGCGTTCGAC 
CCGGCAACAG GCAAGGTCAT CGGCCAGGTG CACCGCCGGC ACCGCCATCA GGAGTTCCTA 
AAGTTCCTGA AGGTCATCGA CGCCAACACC CCCGCCGAGG TGGACCTGCA CCTGGTCCTG 
GACAACTACG CCACCCACAA GACCCCAGCC GTGCACCGCT GGCTGGCCGC GCACCCCCGC 
TTCCACCTGC ACTTCACCCC GACATCAGCA TCCTGGCTCA ACCTCGTCGA GCGCTGGTTC 
GCCGAACTGA CCAACCGCAA ACTCCGCCGG TCCAGCCACC GCAGCCTCAC CGACCTCGAA 
ACCGACGTAC AGACCTGGAT CGAGGCATGG AACACCGAAC CGAAACCGTT CGTCTGGACC 
AGAACCGCAG ACGAAATCAT GAGCAGCCTC GCCGCATACT GTGGTCGAAT TAACGACTCA 
GGACACTAG

Protein sequence

MAGRPRGVVE LTDDERACLS RWARRGKSSQ ALALRSKIVL LCADGLVNTH VALRLGVSRD 
MVGKWRSRFL ARRLEGLVDE PRPGAPRRIS DDRVEEVIVK TLERQPANRD SHWSTRSMAR 
ETGLSQTAVS RIWRAFGLKP HLVDTWKLSA DPMFVEKVRD VVGLYLDPPV KAMVLCVDEK 
SQMQALERTR PMLPMMPTVP ARQTHDYVRH GVASLFAAFD PATGKVIGQV HRRHRHQEFL 
KFLKVIDANT PAEVDLHLVL DNYATHKTPA VHRWLAAHPR FHLHFTPTSA SWLNLVERWF 
AELTNRKLRR SSHRSLTDLE TDVQTWIEAW NTEPKPFVWT RTADEIMSSL AAYCGRINDS 
GH