Gene Sare_2239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2239
Symbol
ID	5705865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2575261
End bp	2576265
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	71%
IMG OID	641271719
Product	transketolase central region
Protein accession	YP_001537090
Protein GI	159037837
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0788664
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.171519
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGCA CGACCATGGC GAAGGCACTC AACGCCGCGC TCGCCGACGC GATGCTCGAG 
GACGATCGGG TGCTCGTGTT CGGCGAGGAC GTCGGCCAAC TCGGCGGGGT CTTCCGGATC 
ACCGACGGGC TGGCGGCCCG CTTCGGCGAC AAGCGCTGTT TCGACACTCC GCTCGCCGAG 
GCCGGCATCG TCGGTTTCGC GGTCGGCCTG GCCATGTCAG GTCTGCGGCC GGTGGTGGAG 
ATGCAGTTCG ACGCGTTCGG GTACCCGGCG TTCGAACAGA TCGCCTCGCA TGTGGCGAAG 
CTGCGCAACC GCACCCGCGG CGCGTTGACC GCGCCCATCG TCATCCGGAT CCCGTACGCC 
GGGGGCATCG GCGGGGTGGA GCACCACTGT GACTCCTCCG AGGCGTACTA CGCGCACACC 
CCCGGCCTGA AGGTCGTCGC CCCGGCCACT GTGGCCGACG CCTACTCGCT GCTGCGCGAG 
GCGATCGACG ACCCGGACCC GGTCGTGTTC CTGGAGCCGA AGAAGCTCTA TTTCGCCAGC 
GCCGAGGCGC AACTGCCGGC CCGGACCGAA CCGTTCGGCC GTGCCGCCGT ACGCCGTCCC 
GGCGCCGGCG CCACCCTGGT CGCGTACGGA CCGGCGGTGC CGGTGGCACT GGAGGCCGCC 
GAGGCGGCCC GGGAGGAGGG CTGGGACCTC GAGGTCGTCG ACGTGCGCAC GATCGTGCCG 
TTCGACGACG ACACGATCGC GGCTTCGGTG CGGAAGACGG GTCGGTGCGT GGTGGTCCAG 
GAGGCTCAGG GTTTCGCCGG GGTCGGCGCG GAGATCGCCG CCCGGGTGCA GGAGCGCTGC 
TTCCACTCTC TGCACGCCCC GGTGCTGCGG GTGTCCGGGC TGGATATCCC GTATCCCGCG 
CCGATGCTGG AGCATACCCA CCTGCCGTCG GTGGATCGGG TGCTCGACGC CGTGGCCCGC 
CTCCAGTGGG ACGACCAGCC CGACGAGCGA TGGGTGGCGG CCTGA

Protein sequence

MASTTMAKAL NAALADAMLE DDRVLVFGED VGQLGGVFRI TDGLAARFGD KRCFDTPLAE 
AGIVGFAVGL AMSGLRPVVE MQFDAFGYPA FEQIASHVAK LRNRTRGALT APIVIRIPYA 
GGIGGVEHHC DSSEAYYAHT PGLKVVAPAT VADAYSLLRE AIDDPDPVVF LEPKKLYFAS 
AEAQLPARTE PFGRAAVRRP GAGATLVAYG PAVPVALEAA EAAREEGWDL EVVDVRTIVP 
FDDDTIAASV RKTGRCVVVQ EAQGFAGVGA EIAARVQERC FHSLHAPVLR VSGLDIPYPA 
PMLEHTHLPS VDRVLDAVAR LQWDDQPDER WVAA