Gene Sare_0108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0108
Symbol
ID	5707057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	121115
End bp	122104
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	69%
IMG OID	641269634
Product	transketolase central region
Protein accession	YP_001535034
Protein GI	159035781
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.741994
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000246371
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCACGG AGACCCTCAC CCTCGGCAAG GCCCTCAACG CCGGGATGCG CAAGGCCCTG 
GAGAACGACC CGAAGGTCGT CATCATGGGC GAGGACGTCG GCAAGCTCGG TGGTGTCTTC 
CGGATCACCG ACGGGCTGCA GAAGGACTTC GGCGACCAGC GGGTGATCGA TACCCCGCTC 
GCCGAGTCGG GCATCATCGG TACCGCAATC GGCCTGGCCA TCCGTGGCTA CCGGCCGGTC 
TGCGAGATCC AGTTCGACGG TTTCGTCTAC CCGGCGTACG ACCAGATCGT GTCGCAGGTG 
GCGAAGATGC ACTACCGCTC CCGCGGCAAG CTCAGGATCC CGATGGTGAT CCGCATCCCG 
TTCGGTGGCG GCATCGGGGC GGTGGAGCAC CACTCCGAGT CGCCCGAGGC CTACTTCGCG 
CACACACCCG GGCTCAAGGT CGCCACCTGC GCCAGCCCGC AGGACGCGTA CGTGATGATC 
CAGCAGGCCA TCGCGTCGGA CGACCCGATC GTGTTCCTCG AACCCAAGCG CCGCTACTGG 
GAGAAGGGGC CGGTCGAGGT CGACGGGCCG CTGCCGGAGG CGTACCCGCT GCACGCCGCC 
CGCGTCGCGC GGCCGGGCAC CGACGCGACC CTGATCGGGT ACGGGCCGAT GGTGCGTACC 
TGCCTGGACG CGGCGACCGC CGCCGCCGAG GACGGCCGTG AGTTGGAGGT CATCGACCTA 
CGCACGCTCG CCCCGCTGGA CCTGGGCCTG GTGTACGAGT CGGTGCGCCG TACCGGTCGG 
GCCGTGGTGG TGCACGAGGC ACCGTCGAAC ATCGGCCTCG GGGCCGAGGT CGCGGCCCGG 
ATCACCGAGG AGTGCTTCTA CTCCCTGGAG TCCCCGGTGC TACGGGTTAC CGGCTTCGAC 
ATCCCCTACC CGGCCTCCCG GGTGGAGGAG GAGTACCTAC CCGACCTTGA CCGGGTGCTC 
GACGCCGTCG ACCGCACCTT CGGCTGGTGA

Protein sequence

MATETLTLGK ALNAGMRKAL ENDPKVVIMG EDVGKLGGVF RITDGLQKDF GDQRVIDTPL 
AESGIIGTAI GLAIRGYRPV CEIQFDGFVY PAYDQIVSQV AKMHYRSRGK LRIPMVIRIP 
FGGGIGAVEH HSESPEAYFA HTPGLKVATC ASPQDAYVMI QQAIASDDPI VFLEPKRRYW 
EKGPVEVDGP LPEAYPLHAA RVARPGTDAT LIGYGPMVRT CLDAATAAAE DGRELEVIDL 
RTLAPLDLGL VYESVRRTGR AVVVHEAPSN IGLGAEVAAR ITEECFYSLE SPVLRVTGFD 
IPYPASRVEE EYLPDLDRVL DAVDRTFGW