Gene Caul_0587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0587
Symbol
ID	5898042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	642215
End bp	644257
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	67%
IMG OID	641561069
Product	dehydrogenase E1 component
Protein accession	YP_001682218
Protein GI	167644555
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit [COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGGGA CGAACCCACG CGCGACAAAG GAAGACGCCG CGAAAGCTGC GTTTCTGTCC 
GAGATGTTTG GCAAGATTTG CTTTGTGCGC GCCTTTGAGG AGGAGGCGCT GCGACTGACT 
CAGGCGAACC CGCCGCGCGT GGCCGGTTCG ATGCACCTCT GCGCAGGACA AGAGGTCGTA 
CCCGTGGCGG CCATGGAGGC CTTGGGGGAC GAAGACCAGG TCGTCTGCAC CTACCGGGGA 
CATGGTTGGG CGCTGGCGGC GGGTCTCGAT CCGGAGGCGG TCATGGCGGA GATCTGCCAG 
CGGTCGACCG GCTTGAACGG CGGGCGCGCG GGGTCCGCCT ATATGATGGC CCCGCACACC 
CGTTTCATTG GCGAGAACTC AATCGTCGGC GCCGGCACGA CGATCGCGTG CGGCGTGGCG 
ATGGCTAACC GCCTACGAGG CCGGGACAAC GTCGTCATGG TCACCATCGG CGATGGCGCG 
ATGAATCAGG GCTCCGTCCA CGAGGCGATG GCTTTCGCTG CGGTGCGAAA GCTGCCTGTC 
ATCTTCGTGG TTGAAAATAA CGGCTGGTCC GAACTCACGC CGACGTCGGA CATGTTCCAC 
GCTGAGCGAC TGGCGGTGCG AGGCAAAGCG TATGGCATCC CATCCGCCAC CATTTCCGGA 
ACCGATCCGG TGGTGGTGCG CGACAGCTTC GCCATGGCGG CCGCTCATGC GCGGGCCGGC 
AATGGACCGT CGCTCATCGA GTGCACGGTT CCTCGGCTGT GGGGGCACTA CAATCGGGAT 
ATCGAGCACT ACCGGTCCAA GGCCGATCGC GCCGAGGCCA CCGCGCGTGA TCCCTTAGTC 
CTGCTTGCCG CCCGCCTCCA GCAGGACGGC GTCATGACTG ACGACGAGGT TGCGGCGATC 
CGGAAGTCGC AAGAGGACGC CGCGCGCGCA TTGGTCTTGC GGGTCATGGC CTCCCCGGCG 
CCCAGCCCGG CCGACGCACT CCAACCGATC CACGGCCAAA CGACGGAGGA TCGAAAAGCG 
CGGGCGCCCG AATCCCGTTC GATGAGTTAC GTCGAGGCGG TGAACGCCGC GCTCCGCGCC 
GAGCTGGAGG AAGACGAACG CACCGTCCTC TATGGCGAGG ATGTCGGTAA GAGCGGCGGC 
ATCTTTGCAG CAAGCCGTTA TCTGCAACGC GACTTCGGCG CAGACCGCGT ATTCGACACG 
CCGATCGCGG AAAACGCGAT CCTAGGCTCG GCGGTGGGCG CGGCCCTTGG CGGCCTGAAA 
CCCATCGTTG AGATCATGTG GGCCGACTTC ATCTTTGTCG CCCTCGACCA GCTGGTGAAC 
CAGGCCGCAA ACGTCCGCTA TATCACTGCG GGCAAGTCCA GCGTGCCGCT GGTCGTGCGG 
ACCCAGCAAG GGGCGACGCC GGGCTCCTGC GCGCAGCATT CGCAATCGAT CGAAGCTATT 
CTCGCCCACG TGCCGGGTCT CAAGGTCGCC TTGGCGGCGA CCCCGCACGA CGCTTATACG 
CTGCTGCGAG CGGCCGCTGC CGATCCCGAT CCTTGCGTGG TGATCGAAGC GCGCGCGCTC 
TATGCCGACA AGGGCGAAGT GGAGATCGCT GCGACTGCGG AACCCGCGGG CCGCGCACGG 
TTGCGCCGCT CCGGCGCCGA CCTCGCCATT ATCACCTGGG GGACCATGGT CGGCCCCGCC 
TTGGCGGCGG CCGAGCGCCT GGCCGCGGCT GGATGCGACA CGGCCGTTTT GGATCTTCGC 
TGGCTGGCGC CCCTCGACGA GGCCGCTCTC CTGGAGGTCG TGCGCAAGGC GGGCGGCCGG 
GTCCTGGTGG TGCACGAGGC CGTAAGGACC GGTGGCTTCG GGGCTGAAAT CGTCGCCCGC 
CTACACGAAG CCCTGACTGG CGAGATGGCG TTGCGCATCC GGCGGGTAAC GACGCCCGAC 
ACGCGGATAC CTGCGGCGCC GTCGCTTCAG GCAGCCCTCA TCCCGGATGC CGACAGCATC 
ATCGCCGCCG CTCTCGCCCT GACCGGCAAG CCGTACGATG TGACCCAGGA GACCGTCGCA 
TGA

Protein sequence

MPGTNPRATK EDAAKAAFLS EMFGKICFVR AFEEEALRLT QANPPRVAGS MHLCAGQEVV 
PVAAMEALGD EDQVVCTYRG HGWALAAGLD PEAVMAEICQ RSTGLNGGRA GSAYMMAPHT 
RFIGENSIVG AGTTIACGVA MANRLRGRDN VVMVTIGDGA MNQGSVHEAM AFAAVRKLPV 
IFVVENNGWS ELTPTSDMFH AERLAVRGKA YGIPSATISG TDPVVVRDSF AMAAAHARAG 
NGPSLIECTV PRLWGHYNRD IEHYRSKADR AEATARDPLV LLAARLQQDG VMTDDEVAAI 
RKSQEDAARA LVLRVMASPA PSPADALQPI HGQTTEDRKA RAPESRSMSY VEAVNAALRA 
ELEEDERTVL YGEDVGKSGG IFAASRYLQR DFGADRVFDT PIAENAILGS AVGAALGGLK 
PIVEIMWADF IFVALDQLVN QAANVRYITA GKSSVPLVVR TQQGATPGSC AQHSQSIEAI 
LAHVPGLKVA LAATPHDAYT LLRAAAADPD PCVVIEARAL YADKGEVEIA ATAEPAGRAR 
LRRSGADLAI ITWGTMVGPA LAAAERLAAA GCDTAVLDLR WLAPLDEAAL LEVVRKAGGR 
VLVVHEAVRT GGFGAEIVAR LHEALTGEMA LRIRRVTTPD TRIPAAPSLQ AALIPDADSI 
IAAALALTGK PYDVTQETVA