Gene Caul_0235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0235
Symbol
ID	5897509
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	257068
End bp	258468
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	67%
IMG OID	641560719
Product	dihydrolipoamide dehydrogenase
Protein accession	YP_001681870
Protein GI	167644207
COG category	[C] Energy production and conversion
COG ID	[COG1249] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide dehydrogenase (E3) component, and related enzymes
TIGRFAM ID	[TIGR01350] dihydrolipoamide dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.982675
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.892356
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCAAT ACGACGTCGT CATCATCGGG GGCGGCCCCG GCGGCTACAA CGGCGCGATC 
CGCGCTGGGC AACTGGGTCT GAAGACCGCC ATCATCGAGG GCCGCGGCAA GCTGGGCGGA 
ACCTGCCTGA ACGTCGGCTG CATGCCGTCC AAGGCCCTGC TACACGCCTC GGAGATGTAC 
GAGGCCGCCG TCGGTCCAGA ATTCGCCAAG CTGGGCATCG AGGTCAAGCC GACGCTGAAC 
CTGCCGCAGA TGATGGCCCA GAAGGCCGAG AGCGTCGAAG CCCTGACCAA GGGCGTCGAG 
TTCCTGATGA AGAAGAACAA GGTCGACTAC ATCAAGGGCT GGGGCCGCAT CGACGGACCC 
GGCAAGGTGG TTGTGAAGGC TGAGGACGGC AGCGAAACCG TGCTCGAGAC CAAGAACATC 
GTCATCGCCA CGGGCTCCGA GCCCACCCCG CTGCCGGGCG TGACCATCGA CAACAAGCGC 
ATCGTCGATT CGACCGGCGC CCTGAGCCTG CCGGAAGTGC CCAAGAGCCT GATCGTGGTC 
GGGGCCGGCG TCATCGGCCT GGAACTCGGC TCGGTCTGGA AGCGCCTGGG CGCGGACGTC 
ACCGTGGTCG AATATCTGGA CCGCATCATT CCGGGCACCG ACACCGAGGT CGCCACCGCC 
TTCCAGAAGA TCCTCACCAA GCAGGGCTTC AAGTTCAAGC TGGGTTCGAA GATCACCGGC 
GCGACCGCCA CCGACAAGCA GGTCCAGGTC ACCGTTGAAC CGGCCGCCGG CGGCGCGGCC 
GAGACATTGC AGGCCGACTA CGTGCTGGTG GCCATCGGCC GTCGTCCGTT CACCCAGGGC 
CTGGGCCTGG AAACCGTCGG CATCGTGCCA GACAAGCGCG GCGTGATCGC CAACGACCAC 
TTCAAGACCT CGGCCGCCGG GGTCTGGGTG GTTGGCGACG TCACCAGCGG CCCGATGCTG 
GCCCACAAGG CCGAGGACGA GGCCATCGCC TGCGCCGAAC TGATCGCCGG CAAGGCCGGT 
CACGTGAACT ACGGCATCAT CCCGGGCGTC ATCTACACCA AGCCGGAAGT CGCCACGGTC 
GGCCAGACCG AGGACGAGCT GAAGGCCGCG GGCGTCGCCT ACAAGGTCGG CAAGTTCCCG 
TTCCTGGCCA ACAGCCGCGC CAAGATCAAC CATGAAACCG ACGGCTTCGT GAAGGTGCTG 
GCCGACGCCA AGACCGACCG CATCCTGGGC GCCCACGCCG TGGGTCCCAA TGTCGGCGAC 
ATGATCGCGG AGTTCTGCGT GGCCATGGAG TTCGGCGGCG CCTCGGAGGA CGTGGCCCGC 
ACCTGCCACC CGCATCCCAC CCGTTCGGAA GCCCTGCGCC AGGCGGCCAT GGGCGTCGAG 
GGCTGGGTGA CGCAGGCCTA G

Protein sequence

MAQYDVVIIG GGPGGYNGAI RAGQLGLKTA IIEGRGKLGG TCLNVGCMPS KALLHASEMY 
EAAVGPEFAK LGIEVKPTLN LPQMMAQKAE SVEALTKGVE FLMKKNKVDY IKGWGRIDGP 
GKVVVKAEDG SETVLETKNI VIATGSEPTP LPGVTIDNKR IVDSTGALSL PEVPKSLIVV 
GAGVIGLELG SVWKRLGADV TVVEYLDRII PGTDTEVATA FQKILTKQGF KFKLGSKITG 
ATATDKQVQV TVEPAAGGAA ETLQADYVLV AIGRRPFTQG LGLETVGIVP DKRGVIANDH 
FKTSAAGVWV VGDVTSGPML AHKAEDEAIA CAELIAGKAG HVNYGIIPGV IYTKPEVATV 
GQTEDELKAA GVAYKVGKFP FLANSRAKIN HETDGFVKVL ADAKTDRILG AHAVGPNVGD 
MIAEFCVAME FGGASEDVAR TCHPHPTRSE ALRQAAMGVE GWVTQA