Gene Sare_0109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0109
Symbol
ID	5707037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	122104
End bp	123279
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	68%
IMG OID	641269635
Product	pyruvate dehydrogenase (acetyl-transferring)
Protein accession	YP_001535035
Protein GI	159035782
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID	[TIGR03181] pyruvate dehydrogenase E1 component, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.99267
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000248753
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCAAAGG GCGACCCCGG GGTCAACACC CGCGGCCGGC GGGCCGTACC CCGATCCAGG 
AAGGGCGCGA CCGGCGACCC CGAGCTGGTG CAGCTACTCA CCCCCGAAGG TGAGCGCATC 
GAGAGTGTGA CCGGGCCGGA CGGCATCGAG TACCGGGTCG ACTTCACCGA CGAGGAGTAC 
CGCGGCTTCT ATCGGGACCT GGTGCTGGTG CGGAAGCTGG ACGCCGAGGC CACCGCCCTG 
CAGCGGCAGG GCGAACTGGG CCTCTGGGCG AGCCTGCTCG GCCAGGAGGC GGCCCAGGTC 
GGTTCCGGCC GGGCGCTCCG CACGCAGGAC ATGGCCTTCC CGACCTACCG GGAGCACGGC 
GTCCTCTACT GCCGGGGTAT CGACCCGATC ATGCCGCTGG GCCTGTTCCG CGGGGTCGAT 
CAGGGCGGCT GGGATCCGAA CGAGTTCAAG TTCAACATGT ACACGATCGT GATCGGGGCA 
CAGGCCCTGC ACGCGACCGG ATACGCCATG GGCGTCACCA TGGACGGCAA GACCGGTACC 
GACGAGGGCG AGGCGGTGAT CGCCTACTTC GGCGACGGCG CCACCAGCCA GGGGGACGTC 
AACGAGTCCT TCGTCTGGGC CAGCGTGTTC AACGCGCCGA TGGTCTTCTT CTGCCAGAAC 
AACCAGTACG CCATCTCGGA GCCGCTGGAG CGGCAGACAC GCATTCCGCT CTACCGGCGG 
GCCGCCGGCT TCGGCTTCCC CGGCCTCCGG GTGGACGGCA ACGACGTGCT GGCCACGTAC 
GCGGTGACCC GGCACGCACT GGACAACGCG CGACACGGGC AGGGCCCGAG CCTGATCGAG 
GCGTACACCT ATCGGATGGG GGCGCACACC ACCTCCGACG ACCCCACCCG GTACCGGATC 
GCCAGCGAGG TCGAGGCATG GCAGGCGAAG GATCCGATCG CTCGGATGAA GACCTTCCTG 
CAGAAGCAGA AGATCGCTGA CGACGGTTTC TTCACCGAGG TCGACGAGCA GGCCAAGCGT 
GAGTCGGTGC ACCTGCGCGA GCGGGTGCTG GAGATGCCGA ACCCGGAGCC GGGCAGCATG 
TTCGACCACG TCTACCCCAA CGGATCGCCG CTGGTCGACC AGCAGCGGGC GCAGTTCAGC 
CAGTACCTGG AGTCGTTCGA GGGGAGCGCG CACTGA

Protein sequence

MAKGDPGVNT RGRRAVPRSR KGATGDPELV QLLTPEGERI ESVTGPDGIE YRVDFTDEEY 
RGFYRDLVLV RKLDAEATAL QRQGELGLWA SLLGQEAAQV GSGRALRTQD MAFPTYREHG 
VLYCRGIDPI MPLGLFRGVD QGGWDPNEFK FNMYTIVIGA QALHATGYAM GVTMDGKTGT 
DEGEAVIAYF GDGATSQGDV NESFVWASVF NAPMVFFCQN NQYAISEPLE RQTRIPLYRR 
AAGFGFPGLR VDGNDVLATY AVTRHALDNA RHGQGPSLIE AYTYRMGAHT TSDDPTRYRI 
ASEVEAWQAK DPIARMKTFL QKQKIADDGF FTEVDEQAKR ESVHLRERVL EMPNPEPGSM 
FDHVYPNGSP LVDQQRAQFS QYLESFEGSA H