Gene Caul_0731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0731
Symbol
ID	5898185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	789041
End bp	790090
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	68%
IMG OID	641561211
Product	HpcH/HpaI aldolase
Protein accession	YP_001682360
Protein GI	167644697
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2301] Citrate lyase beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.629928
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACCC CCAGAGGCTT TTTCAAACCC CTGGCCATCG GAGCCCCCAC GCCCTGGCGC 
GAGCCGCCGG CCCGGGTGGA GCGGATGATC CATTTCGTGC CGCCGCACCT GGACAAGGTC 
CGCGCCAAGG TTCCAGAGAT CGCCGCCACG GTCGACGTCA TCCTGGCCAA TCTGGAGGAC 
GCCATCCCCG CCGACGCCAA GGGCGCGGCC CTGGCCGGAA CGATCGCCAT GGCGCGCGAG 
ACCGACTTCA AGGCCCTGGG CGTGGGCCTG TGGGTGCGGA TCAACTGCCT CAACTCGCCC 
TGGCATCTGG ACGAGGTGGC GACCCTGGTC GAGAAGGCGG GCAACCAGAT CGACGTGATC 
ATGGTCCCCA AGGTCGAGGG GCCGTGGGAC ATCTTCTACA TGGACCAACT GCTGGCCTCG 
CTGGAGGCCA AGCACGGCGT CGTCCGGCCG ATCCTGCTGC ACGCCATCCT GGAGACCGCC 
GAAGGGGTGA TGAACGTCGA GCAGATCGCC GGCGCCAGTT CACGCATGCA AGGCATCAGC 
CTGGGTCCGG CGGATCTCGC CGCCAGCCGC GCCATGAAGA CCACCCGCGT GGGCGGCGGT 
CATCCCGGCT ATCGGGTGAT CGAGGACCCG CACGCTGACG GCTCCCCCCG CGTCTCGGTG 
CAGCAGGATC TTTGGCACTA CACCTTCGCC AAGATGGTCG ACGCCTGCGC CGCCCACGGC 
ATCAAGCCGT TCTACGGCCC GTTCGGGGCC ATCGACGACC CGGTCGCCTG CGAGCAGCAG 
TTCCGCAACG CCTTCCTGAT GGGCTGCGCC GGGGCCTGGA GCCTGCACCC CAGCCAGATC 
GAGATCGCCA AGCGGGTGTT CTCGCCGGCC CCCGACGAGG TGATCTTCGC CAAGCGCATC 
CTGGAGGCCA TGCCCGACGG CACGGGCGTG GCCATGCTGG ACGGCAAGAT GCAGGACGAT 
GCGACCTGGA AGCAGGCCAA GGTCATGGTC GATTGCGCGC GGCAGATCGC GGCCAAGGAT 
GCGGAGTATG CGGCGCTGTA TGGGTTTTAG

Protein sequence

MKTPRGFFKP LAIGAPTPWR EPPARVERMI HFVPPHLDKV RAKVPEIAAT VDVILANLED 
AIPADAKGAA LAGTIAMARE TDFKALGVGL WVRINCLNSP WHLDEVATLV EKAGNQIDVI 
MVPKVEGPWD IFYMDQLLAS LEAKHGVVRP ILLHAILETA EGVMNVEQIA GASSRMQGIS 
LGPADLAASR AMKTTRVGGG HPGYRVIEDP HADGSPRVSV QQDLWHYTFA KMVDACAAHG 
IKPFYGPFGA IDDPVACEQQ FRNAFLMGCA GAWSLHPSQI EIAKRVFSPA PDEVIFAKRI 
LEAMPDGTGV AMLDGKMQDD ATWKQAKVMV DCARQIAAKD AEYAALYGF