Gene Caul_3240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3240
Symbol
ID	5900695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3499991
End bp	3501448
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	70%
IMG OID	641563745
Product	hypothetical protein
Protein accession	YP_001684865
Protein GI	167647202
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1545] Predicted nucleic-acid-binding protein containing a Zn-ribbon [COG3425] 3-hydroxy-3-methylglutaryl CoA synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.57921
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.496079
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGG CCACGGGCAT CGTTTCGTTC GGCGCCTATG TCCCGCGCCT TCGTTTGCAG 
CGCGCGGCCA TGGCCCAGGC CACCGCCTGG TTCAATCCGG CCCTGGCGGG GCTTGGTCGC 
GGCGAGCGCG CCATCGCCAA CTGGGACGAG GACGCCGTGA CGATGGCGGT CGAGGCGGCG 
CGCGACTGCC TTGGCGACCG CGACCGGTCT GACCTTGGTC GGGTGATCCT GGCCTCCACC 
ACCTTGCCGT TCGCCGATCG CCAGAACGCC GGAATCGTCA AGGAGGCCCT GGCGCTGGAC 
GATGAGGTGG CCGCTCTGGA CGTCACCGGT TCGCAGCGCT CGGGCGCCTC GGCCCTGATC 
GCCGCCCTGG AGATGGCGAC CGCCGCGCCC GTTCTCTGCA TGGCCTCCGA TCGCCGGCTG 
GCGCGACCGG GCTCGGCCGC GGAATTCCAC AATGGCGACG CCGCGGCCGC GATGCTGGTC 
GGCCGCGACG CGGTGATCGC CGAGTTCCTG GGCGCGCACA GCGTCACGGT GGACTTCGTC 
GACCACTATC GCGCCGCCGG CCAAGACCAT GACTACGAGT GGGAAACACG CTGGATCCGC 
GACGAGGGCT ACGCCAAGCT GATCCCGGCG GCGATCACTG GCGCCCTGCA CAAGCTGGGG 
CTCGAGGCCA GCGCGGTCGA TGTCCTGATC ACAGCCGTCC CAGCCGCTGG CGTCGATCGC 
CTGGTGGCCG CGGCCGCGGG AGTCAGGCCC GAAGCCGTGT GCGAGCCCCT GCATGATCGG 
CTGGGGTTCG CGGGCGCGGC CCAACCGCTC GTCCTGCTGG CCCAAGCCCT GGCGACGGCC 
AGGCCCGGCA TGCTGATCCT GGTCGCGGCG TTCGGCCAGG GCGTCGATGT CCTGGCGTTC 
CGGACGACGG AGCAGATCAC CAGGCGCAAG GCGTGCCTCG GTGTCGATGG TTGGCTGGCG 
CGTCGGCGCC CGGAGTCCAA CTACGTCAAG CACCTGTCGT TTACTGGCGA GGTGGCCCTG 
GACGGCGGCA TGCGCGCGGA ACTGGACCTC AAGACGCCGC CGACCATGCT CTATCGTGAC 
CGGCGCACCA TCCTGTCGCT GATGGGCGGA CGCTGCCGTG TGACCGGCGC CGTCCAGTAC 
CCCAAGACCG ACATATCCGT TTCACCCAAC GCCCGCCTCG TCGGCACCCA GGACGACTAT 
CGCCTGGCCG ACCTGCGGGC GCGGGTCGTC ACCTTCACCG CCGACCACCT GGCTTTCAGC 
CCCGATCCGC CCGGTTGCTA CGGCATGATC GACTTCGACG GCGGGGGCCG GATGATGGTC 
GACATGGTCG ACCTGGACGA GGACGGCCTC AAGGTCGGCG ACCCGGTGCG GATGATGTTC 
CGCCTCAAGC GCGACGATGT CCGGGGCTTC AAGCACTACT TCTGGAAGGC CGCGCCGGAC 
TACCGGCCGG CGAACTGA

Protein sequence

MTMATGIVSF GAYVPRLRLQ RAAMAQATAW FNPALAGLGR GERAIANWDE DAVTMAVEAA 
RDCLGDRDRS DLGRVILAST TLPFADRQNA GIVKEALALD DEVAALDVTG SQRSGASALI 
AALEMATAAP VLCMASDRRL ARPGSAAEFH NGDAAAAMLV GRDAVIAEFL GAHSVTVDFV 
DHYRAAGQDH DYEWETRWIR DEGYAKLIPA AITGALHKLG LEASAVDVLI TAVPAAGVDR 
LVAAAAGVRP EAVCEPLHDR LGFAGAAQPL VLLAQALATA RPGMLILVAA FGQGVDVLAF 
RTTEQITRRK ACLGVDGWLA RRRPESNYVK HLSFTGEVAL DGGMRAELDL KTPPTMLYRD 
RRTILSLMGG RCRVTGAVQY PKTDISVSPN ARLVGTQDDY RLADLRARVV TFTADHLAFS 
PDPPGCYGMI DFDGGGRMMV DMVDLDEDGL KVGDPVRMMF RLKRDDVRGF KHYFWKAAPD 
YRPAN