Gene Caul_0581 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0581
Symbol
ID	5898036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	633516
End bp	634763
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	62%
IMG OID	641561063
Product	pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase
Protein accession	YP_001682212
Protein GI	167644549
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID	[TIGR01349] pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase, long form

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCAAT CAATTGTGAT GCCGGCGCTA TCGGCCGGGA TGGAGGAAGC CACCATTGTG 
CGTTGGCTGA AGACGGTGGG GGACGTTATT GCTCCAGGCG ACCTGATCGC CGAAATCGAA 
ACGGATAAGG CGACGATCGA GCTGGAGGCC GAACAGACCG GGAAGATCGG CAGGATTCTA 
GCGGCGGAGG GCGCGACGGT TGCGGTCAAT GCCGAGATCG CCCTGCTCCT CGCTGAGGGT 
GAACATGTCG ATGATCTTAG CGAGGCTGAG AAAGCTGCGC CGGAGACCGC GAGCGTCGCT 
GTCACGTCCC GAGACGCTGC TGCGGCGGCA GGTTCGATGG ATTCCACACA GCATCGTCGC 
ATTGCCGCAT CGCCGCTCGC TCGTCGGATT GCGCAAGCCA AGGGCGTGGG CCTCGATACG 
CTGAGGGGCA GCGGCCCGCA TGGCCGCATC GTGCGGATCG ACGTTGAAGC CGCCATCTCG 
GCCTTGCCAC AGACTGTGGA CGGCGCGCCC GCAGAGGCCG CTTCTATTTC GCCGCCTGCA 
AGTCGGCTGC ACTTAATCGA TACGCCTTAT ACGGAAATCC CACTCACCAA TATCAGGAAG 
GTTATCGCGC GCCGCCTGAC TGAAGCAAAG GCAACTATTC CGCATTTCTA CCTGGAAGTG 
GATTGCGAAA TCGACGAGCT GCTTAAATCG CGGGAAACGT TAAATGCCCG GAGCGACGGG 
CAATATAACC TTTCGCTCAA CGACCTTGTC ATCAAGGCGG CCGCACTGGC CCTACGCCAG 
GTCCCGGAGG CAAATACGGC CTGGACCGAC GATGCGATAA TCCAGTTCCA GGATGTCGAT 
ATTTCCGTTG CCGTGGCGAC CGACGGCGGC TTGATCACGC CCATCGTCAG ACAGGCTGAC 
AGACGGGGGC TGGCCAGCAT CTCCGCGGAG GTAAGGACAC TGGCGGCTCG CGCTCGCGAG 
GGCCGCTTGG AACCCGCGGA ATTTCAGGGC GGGAGCTTCA CCATCTCCAA TCTTGGCATG 
TTCGGCGTGC GCGCCTTTTC GGCGATCATC AACCCGCCGC AAAGCTGCAT CCTGGCCGTG 
GGGGCCGCCG AACGCCGGCC GGTCGTGCGA GGCGAGGCCT GCGTTCCAGC GACGGTCATG 
ACCTGCACCC TGTCGGTCGA TCATCGTGCT GTCGATGGCG TTGTCGGTGC GCGTTATCTC 
GCCGCCTTCA AATCTCTTAT CGAGCAACCA TTGCGTCTCA TGCTGTGA

Protein sequence

MAQSIVMPAL SAGMEEATIV RWLKTVGDVI APGDLIAEIE TDKATIELEA EQTGKIGRIL 
AAEGATVAVN AEIALLLAEG EHVDDLSEAE KAAPETASVA VTSRDAAAAA GSMDSTQHRR 
IAASPLARRI AQAKGVGLDT LRGSGPHGRI VRIDVEAAIS ALPQTVDGAP AEAASISPPA 
SRLHLIDTPY TEIPLTNIRK VIARRLTEAK ATIPHFYLEV DCEIDELLKS RETLNARSDG 
QYNLSLNDLV IKAAALALRQ VPEANTAWTD DAIIQFQDVD ISVAVATDGG LITPIVRQAD 
RRGLASISAE VRTLAARARE GRLEPAEFQG GSFTISNLGM FGVRAFSAII NPPQSCILAV 
GAAERRPVVR GEACVPATVM TCTLSVDHRA VDGVVGARYL AAFKSLIEQP LRLML