Gene Sare_0511 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0511
Symbol
ID	5705529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	581066
End bp	582172
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	70%
IMG OID	641270037
Product	citrate synthase 2
Protein accession	YP_001535431
Protein GI	159036178
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.043222
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0026302
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCGACT TCAAACCGGG ACTGGAGGGC GTCGTAGCCT TCGAGACCGA GATCGCCGAA 
CCCGATCGGG AGGGTGGTTC GCTGCGCTAT CGCGGCGTCG ATATCGAAGA TCTTATCGGT 
CAGGTCTCGT TCGGCAACGT CTGGGCCCTG TTGGCGGATG GGCGCTTCGG CCCGGGACTG 
CCGCCGGCCG AGCCGTTCCC GGTCCCGGTG CACTCCGGCG ACATCCGGGT CGACGTGCAG 
TCCGCTGTGG CGATGCTCGC CCCGTACTGG GGTCTCCACC AGCTGCTCGA CATCTCCGAC 
GAGCAGGCCC GCGAGGACCT CGCCCGGGTC TCGGTGACCG CGCTCTCCTT CGTCGCCCAG 
TCCGCGCGGG GTCTGGGCCT GCCGGCAGTG CCGCAGAAGG AGATCGACAA GGCGTCCACC 
ATCGTCGAAC GCTTCATGAA GCGCTGGCGG GGCGAACCGG ACCCGCGGCA CGTCAAGGCC 
GTCGACGCCT ACTTCATCTC CGCCGCCGAG CACGGCCTGA ACGCCTCCAC CTTCACCGCC 
CGCATCGTGG CCTCCACCGG CGCGGACGCG GCGGCCTGCA TCTCCTCCGG CATCGGCGCA 
CTCTCCGGGC CGCTACACGG CGGTGCGCCC TCCCGGGTAC TGAACATGCT CGAGGCGGTT 
GAGCGCAGTG GTGACGCCGA GGGGTACGTA CGGGGCGTAC TCGACCGCGG TGAGCGGCTG 
ATGGGTTTCG GTCATCGGGT CTACCGCGCC GAGGACCCGC GGGCCAGGGT GCTCCGCCGC 
ACCGCCAAGG AACTGGGTGC CCCGCGCTTC GAAATCGCGG AGGCGCTGGA GAAGGCCGCC 
CTGACCGAAC TGCACAGCCG CAAGCCGGAC CGGATTCTCG CCACCAACGT CGAGTTCTGG 
TCGGCGGTCG TGCTGGACTT CGCCGAGGTA CCCGCCCATA TGTTCACCTC GATGTTCACC 
TGCGCCCGAA TGGGCGGCTG GAGCGCGCAC ATTCTGGAAC AGAAGAAGCT GCAGCGACTC 
GTCCGCCCGT CCGCCCGCTA CGTCGGGCCC GGCCCCCGCA GGCCGCACGA GGTCGAGGGC 
TGGGACCAGG TCCCGCACGG CGTCTGA

Protein sequence

MADFKPGLEG VVAFETEIAE PDREGGSLRY RGVDIEDLIG QVSFGNVWAL LADGRFGPGL 
PPAEPFPVPV HSGDIRVDVQ SAVAMLAPYW GLHQLLDISD EQAREDLARV SVTALSFVAQ 
SARGLGLPAV PQKEIDKAST IVERFMKRWR GEPDPRHVKA VDAYFISAAE HGLNASTFTA 
RIVASTGADA AACISSGIGA LSGPLHGGAP SRVLNMLEAV ERSGDAEGYV RGVLDRGERL 
MGFGHRVYRA EDPRARVLRR TAKELGAPRF EIAEALEKAA LTELHSRKPD RILATNVEFW 
SAVVLDFAEV PAHMFTSMFT CARMGGWSAH ILEQKKLQRL VRPSARYVGP GPRRPHEVEG 
WDQVPHGV