Gene Caul_1501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1501
Symbol
ID	5898956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1594435
End bp	1595730
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	69%
IMG OID	641561988
Product	amidohydrolase
Protein accession	YP_001683129
Protein GI	167645466
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.190577
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0701308
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGCAA GAGTTTCGGC GTTGGCGCTC GCCATCGCAT TGGCAAGCGC GCCCGCGTTC 
GCCGTTCCGA CAACCGCCCA GGTGGCCGCC GCCGCCAAGG CCGTCCAGCC CAAGGTCGTG 
GCCTGGCGGC GCGATATTCA CGAGCATCCC GAACTGGGCA ACCAGGAGGT CCGCACGGCG 
GCCCTGGTGG CCAAGGAACT GCGCGCCCTC GGCTTCGAGG TCCGCGAGGG CGTGGGCCGC 
ACCGGCGTGG TCGGGGTGCT GAAGGGCGGC AAGCCCGGCA AGGTCGTGGC CCTGCGCGCC 
GACATGGACG CCCTGCCGGT CGAGGAGAAG ACCGGCCTGC CGTTCGCCTC CAAGGTCACG 
GCCCCGTGGG AAGGCAAGAC CCTGCCGGTC ATGCACGCCT GCGGCCACGA CACCCACGTG 
GCCATGCTGC TGGGAACCGC GACCGTGCTG GCCGGCATGA AGGCGCAGAT CCCCGGAACC 
GTCGTGCTGA TCTTCCAGCC GGCGGAAGAG GGCTCCCAGG CCGGCGAAGA GGGCGGCGCC 
AAGCTGATGA TCCGCGACGG GGCGCTCGAC AGCCCCAAGG TCGACGCCAT CTTCGGCCTG 
CACATCGGCC CCGGCGACGC CAACGCCCTC AACTACCGGG CCGGCGGCTT CTATGCCGGC 
TCGGAGCGGC TGACCATCAC CGTCAAGGGC AAGCAGACCC ACGGGGCGCG GCCCTGGGCG 
GGCATCGACA TGGCCAGCGT CGCGGCCGAC ATCGTCCAGG CCTTCAACCA ACTGGCCGCC 
CGCCAGATCG ACGTCGGCGC CTCGCCCACC GTGCTGACCG TGGCGACCAT CAACATGGGG 
GTGCGCAACA ACATCATCCC CGAAGACCTG ACCATGACCG GCACCCTGCG CACCTTCAAT 
CCGCAGCGCC GGGCCGAGGT GATCGACAAG GTCCAGAAGA CGGTGGCGGC GATCGGCGAC 
CGCTATGGCG CCAAGGCCCA GGCGGTGTTC ACCCAGCCCT ATCCGGTCAC CTATAACGAC 
CCGGCCCTGT CGGCCTGGGT CAAGGCCAGC CTGGAAAAGG CCTCGCCGGG CAAGGTCGAT 
GACCAGGCGG CGCTGGTCAC CGGGGCCGAG GACTTCTCGA TGTACGGCCA GAAGGTCCCG 
GCGGTGTTCG TGCAACTGGG CGGTCGCCCA GCCAACGTCC CGGCGCTCGG CGCGCCGGCC 
AACCACTCGC CCTATTTCGA CGTCGACGAG GCGGTGTTCG AGACCGGCGT GAAGGCCGAG 
GTGCTGATGG CGCTGGACTA TTTGAGCCGC AAATAA

Protein sequence

MFARVSALAL AIALASAPAF AVPTTAQVAA AAKAVQPKVV AWRRDIHEHP ELGNQEVRTA 
ALVAKELRAL GFEVREGVGR TGVVGVLKGG KPGKVVALRA DMDALPVEEK TGLPFASKVT 
APWEGKTLPV MHACGHDTHV AMLLGTATVL AGMKAQIPGT VVLIFQPAEE GSQAGEEGGA 
KLMIRDGALD SPKVDAIFGL HIGPGDANAL NYRAGGFYAG SERLTITVKG KQTHGARPWA 
GIDMASVAAD IVQAFNQLAA RQIDVGASPT VLTVATINMG VRNNIIPEDL TMTGTLRTFN 
PQRRAEVIDK VQKTVAAIGD RYGAKAQAVF TQPYPVTYND PALSAWVKAS LEKASPGKVD 
DQAALVTGAE DFSMYGQKVP AVFVQLGGRP ANVPALGAPA NHSPYFDVDE AVFETGVKAE 
VLMALDYLSR K