Gene Sare_0107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0107
Symbol
ID	5707056
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	119637
End bp	121109
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	71%
IMG OID	641269633
Product	dehydrogenase catalytic domain-containing protein
Protein accession	YP_001535033
Protein GI	159035780
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.390532
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000261598
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCGCGAA TCAAGGAATT CAACCTGCCC GACCTCGGCG AGGGCCTGAC TGAGGGGGAG 
ATCCTCAGCT GGCTCGTGAA GGTGGGCGAC ACCGTCGAGC TGAACCAACC CATCGTCGAG 
GTGGAGACCG CCAAGGCGGC GGTCGAGATC CCGGCGAAGT GGGCCGGCCG GGTCCAGTCG 
ATCTTCCATG CGGAAGGCGC GACCGTCGAG GTCGGGTCGC CGATCATCGC GATCGACACG 
GATCCGACCG CCGGCCCGGT CGAGGCAACG GAGTCGGTTG AGGCGGCCGG CACCGTTTCG 
GGTGCTCCGT CGGCCGCCGC GCCGGCGGCG GTGACCTCCA CCGAGGGTGC GGGCGAGTCG 
GGTCAGGGTG GGCGCACCCC CGTGCTGGTG GGCTACGGCC CGCGCACCAC TGTCGCGAAG 
CGTCGCCCGC GTAAGGGTGC CGCGGCTTCG GCAGCGGTGC CGGCCGCACC GACACCCGCA 
CCGCCGGTAC CCGCACCAGC CGCACCGCCG CGACCGGCAC CCGCACCGGC GGTCACCGGG 
CCGACCACCG TCGGCAACGG GCGCGGCGGT CCGGCCGGCG GCGCTCTGGT GTTGGCCAAG 
CCCCCGGTAC GCAAGCTGGC GAAGGACCTC GGGGTTGACC TGTCCACCCT GACCGGGTCG 
GGTCCGCTCG GCTCGATCAG CCGAGACGAT GTGCAGCGGG CGGCGAGCGC CACCACCACG 
GCCGAACCGC TGGCGGTGGC CGCGGCGGGC AGTACGGCAG CGAGTGTCGG CGCGCACCGC 
GAGCAGCGGA TCCCGGTCAA GGGGGTCCGG AAGCTGACCG CGGAGAACAT GTCCCGCTCG 
GCGTTCACGG CACCGCACGT GACGGAGTTC CTGACCGTCG ACATGACCCG GGCGATGAAG 
GCCCTGGACC GTCTCCGTCA GCGACGCGAG TGGCGGGACG TCCGGGTCTC TCCGCTGCTG 
CTGGTCGCCA AGGCGGTGCT GCTGGCGGTC CGGCGCCATC CGATGGTGAA CGCGACCTGG 
GCCGGCGAGG AGATCGTCGT CAAGGACTAC GTGAACCTCG GCATCGCGGC GGCGACCGAG 
CGCGGCCTGA TCGTGCCGAA CGTGAAGGAC GCGGGGCGGC TCAGCCTGCG GGAGTTGGCG 
GATGCTCTGA CCGATCTCGT GCAGACTGCC AAGACGGGGA AGACCTCCCC GGCGGACATG 
TCCGGCGGCA CCCTGACCAT CACCAACGTC GGGGTCTTCG GCGTGGACAC CGGTACGCCG 
ATTCTGCCGC CGGGTGAGTC GGCGATCCTG GCCTTCGGTG CGGTCCGAAA GATGCCGTGG 
GTGCACAAGG GCAAGGTTCG TCCCCGCCAG GTCACCACGC TCGGGTTGTC GTTCGACCAT 
CGGATCATTG ACGGCGAGCT CGGGTCGAGG TTCCTGCGGG ATGTCGGCGA CTTCCTCGCC 
GATCCCGAGG CGGCGTTGCT CGCCTGGACC TGA

Protein sequence

MSRIKEFNLP DLGEGLTEGE ILSWLVKVGD TVELNQPIVE VETAKAAVEI PAKWAGRVQS 
IFHAEGATVE VGSPIIAIDT DPTAGPVEAT ESVEAAGTVS GAPSAAAPAA VTSTEGAGES 
GQGGRTPVLV GYGPRTTVAK RRPRKGAAAS AAVPAAPTPA PPVPAPAAPP RPAPAPAVTG 
PTTVGNGRGG PAGGALVLAK PPVRKLAKDL GVDLSTLTGS GPLGSISRDD VQRAASATTT 
AEPLAVAAAG STAASVGAHR EQRIPVKGVR KLTAENMSRS AFTAPHVTEF LTVDMTRAMK 
ALDRLRQRRE WRDVRVSPLL LVAKAVLLAV RRHPMVNATW AGEEIVVKDY VNLGIAAATE 
RGLIVPNVKD AGRLSLRELA DALTDLVQTA KTGKTSPADM SGGTLTITNV GVFGVDTGTP 
ILPPGESAIL AFGAVRKMPW VHKGKVRPRQ VTTLGLSFDH RIIDGELGSR FLRDVGDFLA 
DPEAALLAWT