Gene Sare_0645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0645
Symbol
ID	5707844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	726206
End bp	727240
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	66%
IMG OID	641270165
Product	thiamine pyrophosphate binding domain-containing protein
Protein accession	YP_001535558
Protein GI	159036305
COG category	[C] Energy production and conversion
COG ID	[COG1013] Pyruvate:ferredoxin oxidoreductase and related 2-oxoacid:ferredoxin oxidoreductases, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.159967
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000875806
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTCTGAGC CCGTCGCCCT CAAGCTCACC GCGAAGGACT TCAAGTCCAG CCAGGAGGTG 
CGGTGGTGCC CCGGCTGCGG TGACTACGCG ATCCTCGCCG CCGTCCAGGG CTTCATGCCG 
GAGCTGAACA TCCCCCGGGA ACGGATCGTC TTCATCTCTG GAATCGGCTG CTCCTCGCGC 
TTCCCGTACT ACATGAACAC GTACGGGATG CACTCGATCC ACGGCCGCGC CCCAGCGATC 
GCCACCGGGT TGTCCGCCAC CCGCCCCGAC CTGTCCGTCT GGGTGGTCAC CGGAGACGGC 
GACGCGCTGT CGATCGGTGG CAACCACCTG ATCCACGCGC TACGGCGCAA CGTCAACCTG 
AAGATCCTCC TGTTCAACAA CCGGATCTAC GGTCTGACCA AGGGCCAGTA CTCACCGACG 
TCCGAAGTTG GCAAGATCAC CAAGTCGACT CCGGTGGGCT CTGCGGACGC CCCGTTCAAC 
CCGCTTTCGC TGGCACTGGG TGCGGAGGCG ACCTTCGTGG CCCGCACCAT CGACTCGGAC 
CGCAAACACC TGCAGTCGGT GCTTCGGGCC GCCGCCGAGC ATGAGGGCTC CGCGTTCGTG 
GAGATCTACC AGAACTGCAA CATCTTCAAC GACGGAGCGT TCGACCAGCT CAAGGAGCCC 
GCCACCCGGG ACGACTCACT GATCCGGTTG GAGCACGACC AGCCGATCAC GTTTGGCCGG 
GACGGACAGT TCTGCGTCGT GCACCCGCCT GGCGGCTTCG GCCTGGAGGT CCGCGAAACC 
GCGGGCACCG CACCGGAGGA GATCGTGGTC CACGACACCA CCGTCACCGA CCCGGCGTAC 
GCGTTCGCCC TGTCCCGGCT GCCGGGTCTG GACCTGCGCA ACACCCCGAT CGGCGTGTTC 
CGTTCGGTAC GGCGGCCCTC GTACGACAGC GTGGTACAGG AACAACTCGA CGCCGCCCGG 
GCGACCGTGA CCGAGAGCCG CGAGCAGCAG TTCGCCGGGC TGTTGAACAG CGGCGACACC 
TGGACGATCA GCTGA

Protein sequence

MSEPVALKLT AKDFKSSQEV RWCPGCGDYA ILAAVQGFMP ELNIPRERIV FISGIGCSSR 
FPYYMNTYGM HSIHGRAPAI ATGLSATRPD LSVWVVTGDG DALSIGGNHL IHALRRNVNL 
KILLFNNRIY GLTKGQYSPT SEVGKITKST PVGSADAPFN PLSLALGAEA TFVARTIDSD 
RKHLQSVLRA AAEHEGSAFV EIYQNCNIFN DGAFDQLKEP ATRDDSLIRL EHDQPITFGR 
DGQFCVVHPP GGFGLEVRET AGTAPEEIVV HDTTVTDPAY AFALSRLPGL DLRNTPIGVF 
RSVRRPSYDS VVQEQLDAAR ATVTESREQQ FAGLLNSGDT WTIS