Gene Sare_2236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2236
Symbol
ID	5704299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2572489
End bp	2573460
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	71%
IMG OID	641271716
Product	DNA primase small subunit
Protein accession	YP_001537087
Protein GI	159037834
COG category	[L] Replication, recombination and repair
COG ID	[COG3285] Predicted eukaryotic-type DNA primase
TIGRFAM ID	[TIGR02778] DNA polymerase LigD, polymerase domain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.848931
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.182306
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGACGC CGGTCGAGGA GATCCGGGTG GGGCGGCGGC TGGTCCGCGT CTCCAGCCCA 
GACAAACCGT ACTTTCCGGA GCGTGGGCTG ACCAAACTCG ACGTGGTGCG CTACTTCCTT 
GCCGTCGGCG ATGGCATCCT GCGCGCCCTG CGGGACCGGC CGACGATGCT CGAACGGTGG 
CCGCGTGGGG TCTTCGCGGG TGCCAAGATC GCGACTCGGG CGGACAACCG GGGCGACGCC 
TTCTATCAGA AGCGGCTTCC GGCGGGAGCC CCCAGCTGGG TCCGTACCGC ACACATCACG 
TTCCCCAGTG GCCGCAGTGC GGACGAGGTC GCACCGAGCG AACTCGCCGT GGTGGCCTGG 
GCGGTCAACC TCGGCACGCT CCGCTTCCAT CCGTGGCCGG TGTCCCGGCG GGACGTCGAG 
CGACCGGACC AACTGCGCGT CGACCTGGAT CCGCTGCCCG GAGTCGGGTT CGACCAGGTG 
GTTTCGGTGG CACACGAGGT CCGCGCGTTC CTCGACGAGC TCGGGCTGGT GGGCTACCCG 
AAGACCACCG GGGGTCGGGG GCTGCACGTC TACCTCACCA TCGAGCCGCG GTGGAGCTTC 
GGTGACTGCC GCCGGGCGGT GCTGGCGCTG GGCCGGGAGA TGCAGCGTCG CCGGCCCGAT 
CTGGTCACCA CCACCTGGTG GCGGGACCAG CGGGACCGAC CGGTCTTCGT CGACTACAAC 
CAAATGGCCC GCGACCACAC GATGTCCTCG GCGTACTCGA TCCGGCCCAC CCCGGCGGCG 
CTGGTCTCCG CGCCGGTGGG CTGGGGCGAG CTGGACGATG CCCAGCCGGA GGACTTCGAC 
GTCACCACGA TGCCGACCCG CTTCGCCGAG CGCGGCGACC CGCACGCGGG CCTGGACGAC 
CGGGCGTACT CGCTGGAGCC CCTGCTGGAG CTGGCCGACC GGGAGGACCT GACGGTCCCG 
CCGGAGCGTT GA

Protein sequence

MATPVEEIRV GRRLVRVSSP DKPYFPERGL TKLDVVRYFL AVGDGILRAL RDRPTMLERW 
PRGVFAGAKI ATRADNRGDA FYQKRLPAGA PSWVRTAHIT FPSGRSADEV APSELAVVAW 
AVNLGTLRFH PWPVSRRDVE RPDQLRVDLD PLPGVGFDQV VSVAHEVRAF LDELGLVGYP 
KTTGGRGLHV YLTIEPRWSF GDCRRAVLAL GREMQRRRPD LVTTTWWRDQ RDRPVFVDYN 
QMARDHTMSS AYSIRPTPAA LVSAPVGWGE LDDAQPEDFD VTTMPTRFAE RGDPHAGLDD 
RAYSLEPLLE LADREDLTVP PER