Gene Sare_2118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2118
Symbol
ID	5704972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2440361
End bp	2441581
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	67%
IMG OID	641271603
Product	C-methyltransferase
Protein accession	YP_001536974
Protein GI	159037721
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.510018
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0302661
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACACCA GATGTCGGGT CTGTGGCGGC AAGGTAGGCG AATTCCTCGA CTTGGGGCGG 
CAGCCGACCG CCAACGGCTT CCTACTCCCG CACGAGGTGA ATCGGGAGTT CACGTTCCGG 
CTCGCCGTCG GCGCCTGCGC GGACTGCGCG CTGGTGCAGC TGATCGACGA GGTCTCGCAG 
GAGGTTCGCT ACCATGCCGG ATACCGCTAC CACGCGTCCG GGTCGGCCAG CCACCGCCAG 
CACTTCGAGG GTAACGCACG TCGCCTGCTG GCAACCGAAC TAGGCGGATC CGACCCCTTC 
ATTGTCGAGA TCGGCTGCAA TGACGGTGTC ATGCTCGCCA CCGTCGCCGC AGCCGGAGTC 
CGACACCTGG GAGTCGAGCC GTCGACAAAC GTCGCTGACG TGGCTCGGTC GAGGGGGGTC 
CGGGTGCTGA CCGAGTATTT CGATGCCGGA ACTGCCGCCG CGATCCGGGC GGAGCACGGA 
CCCAGCAACG TGATCTTCGG TGCGAACACC ATCTGCCACA TCGCCCACAT CGAGTCCCTG 
ATGCGGGGCG TCGACGTGCT GCTGACGTCG GACGGGGTGT TCATATTCGA GGAGCCCTAC 
CTCGGCACGA TCGTCGAGGG GCGTGCGTTC GACCAGATCT ACGACGAGCA CGTCTTCTAC 
TTCAGCGTGA CGTCGGTAGC GGCGATGGCC GAGCGGTTCG GCCTCGAACT GGTCGACGCC 
GAACAGATCT CCATGCACGG CGGCGAGATC CGGTACACGC TGGCTCGGGC CGGCGCCCGT 
GTCCCGGCTC CAGGGGTCGC GGCGCTCCTC GCCGACGAGC AGGCCCGCCG ACTGTCCGCG 
CCAGACACGC TCGAGGAGTT CGGGCGGCAC GTGGAACGGG TCCGTGACGA ACTCGTCACC 
CTGCTGCGGC AGATCCGGGC GGACGGGCTG CGGGTGGTCG GGTACGGCGC ACCGGGCAAG 
GCATCGACGG TCACAAACTA CTGTCGGATC GGATCCGACC TCGTCCCGTT CGTGTGCGAC 
TCCACCCCGT CCAAGCAGGG TCACCTCCTG CCCGGCTCAC ACCTGCCGGT ACGCGCGCCG 
GAGGCGTTCG CAGACCCGTA CCCGGACTAT GCGCTGCTGT TCGCCTGGAA CCACGCCGAG 
GAGATCATGG CCAAGGAGCA GGGCTTCCGG GAGGCGGGCG GCCGTTGGAT CCGGTTCGTG 
CCCGAGGTGC GAGTCGACTG A

Protein sequence

MYTRCRVCGG KVGEFLDLGR QPTANGFLLP HEVNREFTFR LAVGACADCA LVQLIDEVSQ 
EVRYHAGYRY HASGSASHRQ HFEGNARRLL ATELGGSDPF IVEIGCNDGV MLATVAAAGV 
RHLGVEPSTN VADVARSRGV RVLTEYFDAG TAAAIRAEHG PSNVIFGANT ICHIAHIESL 
MRGVDVLLTS DGVFIFEEPY LGTIVEGRAF DQIYDEHVFY FSVTSVAAMA ERFGLELVDA 
EQISMHGGEI RYTLARAGAR VPAPGVAALL ADEQARRLSA PDTLEEFGRH VERVRDELVT 
LLRQIRADGL RVVGYGAPGK ASTVTNYCRI GSDLVPFVCD STPSKQGHLL PGSHLPVRAP 
EAFADPYPDY ALLFAWNHAE EIMAKEQGFR EAGGRWIRFV PEVRVD