Gene Sare_3094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3094
Symbol
ID	5706829
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3516841
End bp	3518001
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	65%
IMG OID	641272530
Product	recombinase
Protein accession	YP_001537898
Protein GI	159038645
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0671242
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGGCG ACGTGTCGGA TGACCGAGGT AAAAAGGATC CCCTGGCCCA ATGGCTGAAC 
GAGCAGTCGG AGGCGCGTAC AAAGCCACAG GTCCGTCGGC GGGGCAATCT GCGTTTCGCG 
TTCTACGGTC GGATGTCGAC GGTTGAGCAC CACCTGCTGC CGCTGCTCGA ACAGCACGAC 
GTGCACCTGT GGCTCCCCGA AACGGATGGG CCCGTCGACT GCCGCAAACC GGCCCACCAG 
GCGCTGATCA TGTTGTTGGG TGTCCAGTCG AAGCGCGAGG TGCAGCGTTC CCGGCACCGA 
GTTATCACCG CGATGCGCAC TCAGGCGCGG GAGCAGGGCC GCTACCTTGG CGGCAGGCCA 
CCCTACGGTT ACCAACTGGT CGACGCCGGG CCCCACCCCA ATGCCGCACA CGCTCGATGG 
GGTCGTCGAC TTCAGCGACT CGAACCCGAC CCGGCCACGG CCGCACACGT GCGGCGAATG 
TTCGCCCAAC GACTCTCCGG TCACAGCCTC GCCAGCATCG CTCGCGCCTT GAACGACGAC 
GCCGTCGCCT GCCCCTCAAC CGTCGACCCC GGCCGCAACC ACCACCGCAC AAACGATAGA 
TGGACCCTCC GAACAGCCTC GGCGATCCTC GCCAACCCCC GCTACACCGG CCGGCAGGTA 
TGGAACCGGC AACGCACCGA CATCGACACC GCCGACGGCA ACCGCGACGC ACACGGAACC 
GTCCGATGGA ACAACACGAA GGACTGGGTG ATCTCCAAAC AACAAGCCCA CACCGCCCTT 
GTCACCGAGC AGGAGTTCAT CGCCACCCAG GCCATCCGCT CCCGCCGAAG CGCCCACGAC 
GGCACCACCC GCAGCTACCT ACTCACCGGC CTGCTGCGAT GCGGATCATG CGGCCGGAGG 
ATGGACGCCC ACTGGGTCAA CCAACGCCCC GGCTACCGAT GCCGCCACGG GCACACCAGC 
ACCCAACACC CCGCCAGCCA ACGCCGCAAG ATCCTCTACC TGCGGGAGGA CCACGTCATC 
GCCAGACTGG CCGGCCATCC CAGCATCGCC AGAGACACTC ACAGCCCGCA CGCGCTGGCC 
ACTTTCTACG GGAGAATAAG ATACACATCG TGTGCGATCA AACGCATTGC ACACCAATCA 
CGACTAGATC TGTGCAGGTA G

Protein sequence

MKGDVSDDRG KKDPLAQWLN EQSEARTKPQ VRRRGNLRFA FYGRMSTVEH HLLPLLEQHD 
VHLWLPETDG PVDCRKPAHQ ALIMLLGVQS KREVQRSRHR VITAMRTQAR EQGRYLGGRP 
PYGYQLVDAG PHPNAAHARW GRRLQRLEPD PATAAHVRRM FAQRLSGHSL ASIARALNDD 
AVACPSTVDP GRNHHRTNDR WTLRTASAIL ANPRYTGRQV WNRQRTDIDT ADGNRDAHGT 
VRWNNTKDWV ISKQQAHTAL VTEQEFIATQ AIRSRRSAHD GTTRSYLLTG LLRCGSCGRR 
MDAHWVNQRP GYRCRHGHTS TQHPASQRRK ILYLREDHVI ARLAGHPSIA RDTHSPHALA 
TFYGRIRYTS CAIKRIAHQS RLDLCR