Gene Sare_3317 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3317
Symbol
ID	5707184
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3828469
End bp	3829647
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	70%
IMG OID	641272744
Product	transaldolase
Protein accession	YP_001538111
Protein GI	159038858
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0176] Transaldolase
TIGRFAM ID	[TIGR00876] transaldolase, mycobacterial type

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.706771
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00145949
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGGACA GGCTGGGTGA GCTCACCGCC GCGGGCGTGG CGGTCTGGCT CGATGATCTT 
TCACGGATAC GACTCAGCTC CGGCGAGCTG GACCGGTTGC GCCGGGAGAA GCACCTGGTC 
GGCGTGACCA CCAACCCGAC GATCTTCGCG AAGGCCCTGG GCGACGCCGA GGAGTACGAC 
TGGCAGTTGC ACGACCTCGC TATGCGCGGG ATAGCCGTCG AGGAGGCGGT GCGCAACCTC 
ACCGCGTACG ACGTGCGCTG GGCCTGTGAT GTGATGCGAC CGGCGTACGA GGCGTCGGCG 
GGCGTGGACG GACGGGTCTC ACTGGAGGTG GACCCCCGGC TGGCGTACGA GACGGACAAG 
ACCGTCGCCG AGGCGCGGGC GCTCTGGTGG CTGGTCGACC GACCGAACCT GTTCATCAAG 
ATCCCGGCCA CCGAGGCCGG GCTCCCGGCG ATCACCGCGG CCCTGGCCGA GGGGATCAGC 
GTCAACGTCA CCCTGATCTT CGGCCTGGAC CGCTATTCGG CGGTGATGGA GGCGTTCCTG 
GCCGGCCTGG AGCAGGCCAA GGCGAACGGC CACGACCTGT CCAAGATCGG CTCAGTGGCG 
TCGTTCTTCG TCTCCCGGGT CGACACCGAG GTCGACAAGC GGCTGGAGAA GATCGGCTCG 
GAGCAGGCCA GCAAGCTGCG CGGTCGGGCC GCGGTCGCCA ACGCCCGACT GGCCTACGAG 
CGCTACAGCC AGGTCTTCGC CTCCGACCGG TGGCAGGCGC TCGCCGACGC CGGGGCGCAC 
CCGCAGCGAC CGCTGTGGGC CTCCACCTCG ACGAAGAACC CGGACTACCG GGACGTGATC 
TACGTCGAAG AGCTGATCGC CCCCGGCACG GTCAACACGA TGCCCGAGCC GGTGATCAAC 
GCCTACGCCG AGCACGGCGA GACCAGCGGC GACACGGTGA CTGCGGCCTA CGACGAGGCC 
CGGACGGTCT TCGCGGGCCT GGCGTCGGCG GGTGTCGACA TGACCGACGT GATCGACACC 
CTGGAACGCG AGGGGGTGGA GAAGTTCGAG GCGAGCTGGA ACCAGCTACT CGAAGGCGTC 
CGCAGGTCCC TCGCCGCCGC CGACCAGGGC ACCGACCACC CCGGCGACGC CGCCAGAAGC 
AACGCGCAGG CCGCCGAGCG GGCGGGGGGC AACGCGTGA

Protein sequence

MTDRLGELTA AGVAVWLDDL SRIRLSSGEL DRLRREKHLV GVTTNPTIFA KALGDAEEYD 
WQLHDLAMRG IAVEEAVRNL TAYDVRWACD VMRPAYEASA GVDGRVSLEV DPRLAYETDK 
TVAEARALWW LVDRPNLFIK IPATEAGLPA ITAALAEGIS VNVTLIFGLD RYSAVMEAFL 
AGLEQAKANG HDLSKIGSVA SFFVSRVDTE VDKRLEKIGS EQASKLRGRA AVANARLAYE 
RYSQVFASDR WQALADAGAH PQRPLWASTS TKNPDYRDVI YVEELIAPGT VNTMPEPVIN 
AYAEHGETSG DTVTAAYDEA RTVFAGLASA GVDMTDVIDT LEREGVEKFE ASWNQLLEGV 
RRSLAAADQG TDHPGDAARS NAQAAERAGG NA