Gene Sare_3620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3620
Symbol
ID	5708167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4177138
End bp	4178307
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	73%
IMG OID	641273045
Product	Acyl transferase
Protein accession	YP_001538409
Protein GI	159039156
COG category	[I] Lipid transport and metabolism
COG ID	[COG0331] (acyl-carrier-protein) S-malonyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000683569
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGCTCGCCG TACTCTCCCC CGGCCAGGGT TCCCAGAAAC CCGGCTTCCT GACCCCCTGG 
CTCGATCTGC CCGGCACCGA GGCGCGGCTG CGCTGGTGGT CCGCGCTCGC CGGGGTCGAC 
CTGGTACACC TCGGCACGGC CGCGGACGCC GACGAGATCA AGGACACCGC TCGCACCCAG 
CCGCTGCTCG TCGCGGCGGC ACTACTCGCC GCCGAGCACC TGCCGATGCA CGACGTCACG 
CTCACCGCCG GCCACAGCGT CGGTGAGCTG GGCGCGACGT CACTCGCCGG TGTCCTCACC 
CCGGAGGCCG CGGTCACGCT GGCCGCCGTC CGGGGCCGCG AAATGGCAGC CGCCTGCGCG 
CTGGAGCCAA CCGGGATGGC GGCGATGCTC GGTGGTGATC CCGACGAGGT GCTCGCCGCG 
ATCGACGCAC ACGGGCTCCA CCCGGCCAAC CGCAACGGCG CCGGCCAGAT CGTCGTCGCC 
GGTTCACTGG CCGGACTGGA CAAACTCGCC GCCGAACCGC CGGCCCGCAC CCGCGTCGTC 
CGGCTGAAGG TGGCCGGCGC CTTCCACACG CCGTACATGG CATCGGCCGA GACCGCTCTG 
GCCGCCGTCG CAGCCGGCGT GACCCCCGCC GACCCGACCC ACATCCTGCT GTCGAACCTC 
GACGGCGCCG CCGTCAACCA CGGCCGGGAG ATGGTGCAGC GGCTGATCCG CCAGATCACC 
GCCCCGGTCC GCTGGGACCT GTGCCTGCGC ACGCTCGCCG ATCTCGGCGT GACCGGAGTG 
ATCGAACTAC CCCCGGCCGG CGCCCTCGCC GGCCTGGTCA AACGAGAACT GAAGGGCGAT 
GCCGCCCCGG AGATCGTCAC TCTCAACACC CCGGACGACC TGCCCGCCGC ACGGGACCTG 
ATCGCCCGAC ACAGCGGCCT CGGTGGCCAC GAGCCGGTCA TCCAGTTCCG GGTCGTGGTC 
TCTCCCGCCG CCGGCACCTT CACACCCGTC GACGGGCTGG CCGAGGGCGT TGACCTACGC 
GCTGGCCAGA TCATCGGTCA CATCGCCACC CGGCAGGGCT CCGTCGAGGT CACCGCCCAC 
GACAGCGGGC TACTCACCGA GTGGCTCGCC CATCACGACG ACCCGGTGGC CCCGGGCCAG 
CCGCTGGCCC GAATCGGCGG CCACACATGA

Protein sequence

MLAVLSPGQG SQKPGFLTPW LDLPGTEARL RWWSALAGVD LVHLGTAADA DEIKDTARTQ 
PLLVAAALLA AEHLPMHDVT LTAGHSVGEL GATSLAGVLT PEAAVTLAAV RGREMAAACA 
LEPTGMAAML GGDPDEVLAA IDAHGLHPAN RNGAGQIVVA GSLAGLDKLA AEPPARTRVV 
RLKVAGAFHT PYMASAETAL AAVAAGVTPA DPTHILLSNL DGAAVNHGRE MVQRLIRQIT 
APVRWDLCLR TLADLGVTGV IELPPAGALA GLVKRELKGD AAPEIVTLNT PDDLPAARDL 
IARHSGLGGH EPVIQFRVVV SPAAGTFTPV DGLAEGVDLR AGQIIGHIAT RQGSVEVTAH 
DSGLLTEWLA HHDDPVAPGQ PLARIGGHT