Gene Sare_2238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2238
Symbol
ID	5704301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2574113
End bp	2575261
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	72%
IMG OID	641271718
Product	pyruvate dehydrogenase (acetyl-transferring)
Protein accession	YP_001537089
Protein GI	159037836
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID	[TIGR03181] pyruvate dehydrogenase E1 component, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.191057
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.196658
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGACCA CACCCCGGGC GGTCCGCAGA AAGTCCCGGC CGGCCGCACA GCCGGACCCG 
GCCCACCCAC TACTGCCAGC CGGTGAACAG ATCCGCCTGC TCGACCCCGC CGGCACTCCG 
CTCCCGGCTC ACCCCGACTA CCCAGAGCCA CCCGTCGAGG CGCTCGTCGA GCTGTACCGG 
CGGATGGTGA TCGGCCGCCG GTTCGACCAA CAGGCCACAG CGCTGACCAA ACAGGGCCGG 
CTGGCCGTCT ACCCGTCCGC CCGGGGTCAG GAGGCGTGCC AGGTCGGCGC GGTCCTCGCA 
CTGCGCGACG ACGACTGGGT GTTCCCGACC TACCGTGAGT CCATGGCGCT GACCGCCCGG 
GGGATCGACC CCGTCGAGGT GCTGACCCTG CTGCGCGGAG ACTGGCACTG CGGCTACGAC 
CCGGTCCTCC GGCGAAGCGC CCCGCAGTGC ACCCCGCTGG CGACCCAGTG CGTGCACGCC 
GCCGGCCTCG CCTACGGGGA GGCGTACCAG GGCCGGGAGA CGGTGGCCCT GACCTTCATC 
GGCGACGGCG CCACCAGCGA GGGCGACTTC CACGAGGGGG TCAACTTCGC CGCCGTGTTC 
AAGGCGCCGG TCGTCTACTT TGTGCAGAAC AACCGGTACG CGATCAGCGT CCCGCTGTCC 
CGACAGACCG CCGCGCCCAG TCTGGCGTAC AAGGGCGTCG GCTACGGCGT GCCCAGCGAG 
CAGGTCGACG GCAACGACCC GGTCGCCGTG CTCGCCGTGC TCACCCGGGC CGTGGCACAC 
GCCCGCGCCG GCCACGGCCC CTTCCTGGTG GAGGCTCACA CCTACCGGAT GGAGCCACAC 
ACCAACGCCG ACGACGCCAC TCGCTACCGC GACGCCGATG AGGTGGCCGT CTGGCAGGAC 
CGTGACCCGG TCGCCCGGTT GGAGACCTAC CTGCGAGCCC GGCGCGCGTT GGACGACACC 
ATCGTGGCGC GGGTCGCCGG GCAGGCCGAG GAGTACGCGG CCGATCTGCG CGAGCGGATG 
CACGACAAGC CGACCGTCGA CCCGATGACG CTCTTCGACC ACGTCTACGC CGAACCGACG 
CCGCAACTGG CCGAACAGCG CGAGCAGGTC CGCGCCGAAC TGACCGCCGA CCAGGAGGGA 
GCCGCGTGA

Protein sequence

MTTTPRAVRR KSRPAAQPDP AHPLLPAGEQ IRLLDPAGTP LPAHPDYPEP PVEALVELYR 
RMVIGRRFDQ QATALTKQGR LAVYPSARGQ EACQVGAVLA LRDDDWVFPT YRESMALTAR 
GIDPVEVLTL LRGDWHCGYD PVLRRSAPQC TPLATQCVHA AGLAYGEAYQ GRETVALTFI 
GDGATSEGDF HEGVNFAAVF KAPVVYFVQN NRYAISVPLS RQTAAPSLAY KGVGYGVPSE 
QVDGNDPVAV LAVLTRAVAH ARAGHGPFLV EAHTYRMEPH TNADDATRYR DADEVAVWQD 
RDPVARLETY LRARRALDDT IVARVAGQAE EYAADLRERM HDKPTVDPMT LFDHVYAEPT 
PQLAEQREQV RAELTADQEG AA