Gene Cwoe_5072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_5072
Symbol
ID	8735538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	-
Start bp	5420187
End bp	5421158
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	73%
IMG OID	646505697
Product	Pyruvate dehydrogenase (acetyl-transferring)
Protein accession	YP_003396856
Protein GI	284046516
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0496091
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.175509
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGACG GGGCGGTGCG CATGACCGAC GCCGAGCTGC TCGGGATGCT GCGGCGGATG 
ATCGAGATCC GCGGCTTCGA GGACGAGATC CAGCGCGCGT TCACGAAGAA CCTCGTACGC 
GGCTCGACGC ACCTCTGCAA CGGCCAGGAG GCGTGCGTCG TCGGCGCCTG CGGCGCGCTG 
CGCGAGGGCG ACTCGATGGT CTGCACCTAC CGCGGCCACG GCGCCGTGCT GGCGATGGGC 
GCGCCGCTGG AGGGGACGTT CGCCGAGATC CTCGGCCGCG AGACGGGCCT CTGTCGCGGC 
AAGGGCGGCT CGATGCACCT GACCGACGTC GGCGTCGGCG CCTACGGCTC GTTCGCGATC 
GTCGGCGCGC ACCTGCCGAT CGCGACCGGC CTCGCCCTCG CCGCCAAGCT CGACAGAAGC 
GAGGCCGTCA GCCTCTGCTT CTTCGGCGAC GGCAGCATGA ACATCGGCGC GGTCCACGAG 
GCGATGAACC TCGCCGGGAT CTGGAAGCTG CCGGTGATCT TCTTCTGCGA GAACAACCTC 
TACGGCGAGT ACTCGCCGCT CGCCACGACG ACGCCGGTCG AGGAGCTGGC CGCGCGCGCG 
GCCGGCTACG GGATGCCGGG CGTGCGCGTC GACGGCAACG ACGTCGTCGC CGTCCACGCG 
GTCGTCTCCG AGGCCGTCCG GCGCGCCCGC TCCGGCGAGG GGCCGACGTT CGTCGAGGGC 
CTGACCTACC GCCACCGCGG CCACTCGCGC ACCGACCCGG CGAGATACCG GCCGGAGGGC 
GAGCTGGAGC GGTGGCTGGA GCTGGACCCG ATCCCGCGGC TGGAGGCGCT GCTGCGCGAG 
CGCGGCGTCG CGGACGGCGC CGTCACGCAG GCGCGCGCCG ACGCGGAGGA GGCCGTCGCG 
ACGGCGTACG CGGCGGCGCT CGCCGCGCCC GCGCCCGGCC TGGAGCTGAT CTACGAGGAC 
GTCTACGCAT GA

Protein sequence

MKDGAVRMTD AELLGMLRRM IEIRGFEDEI QRAFTKNLVR GSTHLCNGQE ACVVGACGAL 
REGDSMVCTY RGHGAVLAMG APLEGTFAEI LGRETGLCRG KGGSMHLTDV GVGAYGSFAI 
VGAHLPIATG LALAAKLDRS EAVSLCFFGD GSMNIGAVHE AMNLAGIWKL PVIFFCENNL 
YGEYSPLATT TPVEELAARA AGYGMPGVRV DGNDVVAVHA VVSEAVRRAR SGEGPTFVEG 
LTYRHRGHSR TDPARYRPEG ELERWLELDP IPRLEALLRE RGVADGAVTQ ARADAEEAVA 
TAYAAALAAP APGLELIYED VYA