Gene Caul_0580 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0580
Symbol
ID	5898035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	632054
End bp	633496
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	63%
IMG OID	641561062
Product	succinic semialdehyde dehydrogenase
Protein accession	YP_001682211
Protein GI	167644548
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01780] succinate-semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCGCTAA GGGATCCGTC CCTCCTCAAA GATCAATGCT TCGTCGGCGG CGCGTGGATT 
GGTTTGCCCC AAGTTGATGT CATCGACCCG GCGAGCGGCG AGAAGATCGC GGCGGTGCCA 
AATTGTGGGG CGAACGAGAC GCAGCAGGCC ATCCAGGCAG CCGATGCCGC GCTGCCCGGC 
TGGCGCGGCC GCACCGCGGC GCAGCGTTCG ACGATCATGC GGCGCTGGTT TGAGGCCACG 
ATCGAGGCGA CCGAAGATCT CGCGCTTATC CTGAGCAGCG AGCAGGGCAA ACCGATCGCC 
GAGGCGCGCG CTGAAATCAT CTACGCCGCC AGCTTCATCG AATGGTTCGC AGAAGAGGCT 
AAGCGAACCT ATGGCGAGGT CATCCCCAGT CCGCGCGCCG ACGCACGGAT CGTCGTGATC 
CAGCAGCCGA TCGGCGTGAC GGCCGCGATC ACGCCGTGGA ATTTCCCGGC CGCCATGATC 
ACGCGCAAGG CTGGTCCGGC GCTGGCGGCG GGTTGCACGA TGGTGTTGAA ACCGGCGATG 
CAGACGCCGT TGACGGCCTT GGCGCTGGCT GCGCTCGCGC AACGCAGCGG CGTCCCTGAT 
GGTGTCTTCA ATGTCGTGAC CGGGAGCGCA CGCGACATCG GCGGGGAACT GACCTCGAAC 
CCCATCGTGC GCAAGATCAG CTTTACCGGA TCGACCGAGA TCGGCCGCCT GTTGATGCGA 
CAGGGCGCTG CGACGGTGAA GAAGATGTCT CTGGAATTGG GAGGAAACGC GCCCTTTATC 
GTGTTCGATG ACGCCGATGT CGAAGCTGCG GTCGAAGGCG CGATGTTGTC CAAATACCGC 
AACAGCGGCC AAACCTGCGT ATGCGTCAAT CGCATATATG TTCAGCGCGG CGTCGCCGAA 
GCGTTCGTCG AGAAGCTGGC CAAGGCGGCG GCGGATCTGC GCGTCGGACG CGGCACGGAC 
GAGGGCGTGA CACAAGGGCC CTTGATTGAC GCCGCGGCGG TGGAGAAGGT CGAAGAGCAT 
GTGGCCGATG CGCTGGCCAA GGGGGCAAGG CTCGTCCTGG GCGGAGCCCG TCATGCCTTG 
GGGGGCACGT TCTTCGAACC GACAATTCTG ACGAACTGTT CGGCGGACAT GCTCGTCGCG 
CATGAGGAGA CGTTCGGTCC TGTGGCGTCG GTCTTCGTAT TCGACGAGGA AGACGAGGCG 
ATCGGCTTGG CGAACGCCAG CGAGTTTGGC TTGGCCGGAT ATTTCTACAG CCGTGACCTT 
GGCCGGGTGT GGCGTGTGGC CGAAGCACTC GAATGCGGGA TGGTCGGCAT CAACACCGGC 
CTGATTTCGA ATGAAGTCGC ACCCTTTGGC GGGATCAAGC AATCGGGCCT GGGACGGGAG 
GGCTCGTCAC ACGGGATCAC CGACTATCTC GAACTGAAAT ATCTCTGCAT GGCCGGCCTC 
TGA

Protein sequence

MSLRDPSLLK DQCFVGGAWI GLPQVDVIDP ASGEKIAAVP NCGANETQQA IQAADAALPG 
WRGRTAAQRS TIMRRWFEAT IEATEDLALI LSSEQGKPIA EARAEIIYAA SFIEWFAEEA 
KRTYGEVIPS PRADARIVVI QQPIGVTAAI TPWNFPAAMI TRKAGPALAA GCTMVLKPAM 
QTPLTALALA ALAQRSGVPD GVFNVVTGSA RDIGGELTSN PIVRKISFTG STEIGRLLMR 
QGAATVKKMS LELGGNAPFI VFDDADVEAA VEGAMLSKYR NSGQTCVCVN RIYVQRGVAE 
AFVEKLAKAA ADLRVGRGTD EGVTQGPLID AAAVEKVEEH VADALAKGAR LVLGGARHAL 
GGTFFEPTIL TNCSADMLVA HEETFGPVAS VFVFDEEDEA IGLANASEFG LAGYFYSRDL 
GRVWRVAEAL ECGMVGINTG LISNEVAPFG GIKQSGLGRE GSSHGITDYL ELKYLCMAGL