Gene Caul_0655 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0655
Symbol
ID	5898110
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	722576
End bp	724228
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	68%
IMG OID	641561137
Product	peptidase M28
Protein accession	YP_001682286
Protein GI	167644623
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.215111
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.412829
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGCC TGCTGCTCGC GACCGCCCTG TTCGCCGCTC CCATGCTGGC TCACGCGGCG 
GACGCGCCCA AGATCGACCC CGCCAGGCTG TCGGCCCACA TCAAGGTGCT GTCGTCCGAC 
GACTTCGAGG GTCGCGGCCC CGCCACGGCC GGCGAGACCA AGTCGGTCGA CTACATCGTG 
GGCCAGATGA AGGCGATCGG GCTGGAGCCT GCCGGCGACC TGAAGAACGG AACCCGCGCC 
TGGACCCAGG ACGTGCCGCT GGGCAAGTTC GACATCAAGG GTCCGGTCTC CGCTCAATTC 
ACGATCGGCG GCAAGGTCGT TCCCCTGGCC CAGGGCGAGC AGATCGCCAT CCGCGCGGCC 
ATGACCAATG TCGACGCCGT CGCCATCAAG GACGCGCCGC TGGTCTTCGT CGGCTACGGC 
GTCAAGGCGC CGGAACGAAG CTGGGACGAC TTCAAGGGCC TGGACCTGAA GGGCAAGGTC 
CTGGTGGTGC TGATCAACGA CCCCGACTTC GAGTCCGGCG CCGGCGACTT CGGCGGCAAG 
GCCATGACCT ATTACGGTCG CTGGACCTAC AAGTACGAGG AAGCCGCCCG CCAGGGCGCG 
GCGGGCGTGC TGATCGTCCA CGAGACCGCC CCGGCCTCCT ATGGCTGGGC GACGGTCAAG 
AACTCCAACA CCGCCACGAT GTTCGACATC GTCCGCGCGG CGCCCGCCAA GGTTCACCCG 
AACCTGGAGG CCTGGATCCA GCGCGACGTC GCGGTCGACC TGTTCAAGGC CTCGGGCCTG 
GACTTCGACC TCCTGAAAAA GCAGGCCCAG GGCCGCGACT TCAAGCCGGT GGACCTGAAG 
GGCGCGACCT TCTCGGCCAG CTACGCCGTC GATCCTTCGG TGATCGTGTC CAAGAACATC 
GCCGGCCGGA TCAAGGGCTC GGCCCATCCC GACGAGACGG TGATCTACAG CGCCCACTGG 
GACCACCTGG GCGTCGGCCA GCCCGACGCG CGCGGCGACA AGATCTATAA CGGCGCCATC 
GACAACGCCG ACGGGATCGC CGCCATCCTG GAGCTGGCCC GCGCCTTCAA GAGCCAGCCG 
GCCCCGCAGC GCTCGATCCT GTTCCTGGCC GTCACCGCCG AGGAACGCGG CCTGCTGGGC 
TCGGAATACT ATGCGGCCAA CCCGCTCTAT CCGCTGTCCA AGACGGTCGG CGACCTGAAC 
ATCGACGCCC TGTCGGCCAC CGGCCCGGCC AAGGACATCA CCACCTCGGG CGACGGCAAG 
GTCGATCTGC AGGACCTGCT GGTCGCCAAG GCCAAGGCTC ATGGCCGCTA CTTCACGCCC 
GACCCGTCGC CGCAAGCCGG CCACTTCTAT CGCTCGGACC ACTTCCCGTT CGCCAAGCGC 
GGCGTGCCGG CCATCTCGGT CGGCTCGGGC GAGGACCTGG TGGTCGGCGG CAAGGAGGCC 
GGCGAGAAGG CCGAGGCCGA CTACACCGCC AACCGCTACC ACCAGCCCGC CGACGAATGG 
AAGGCCGACT GGGACCTGAC GGGCCAGGCC CAGGATATCG GCCTGTTCTA CGAGATCGGT 
TCCGACCTCG CCAATTCGAA GACCTGGCCA GAGTGGCAGG CGGGATCGGA GTTCAAGGCG 
CTGCGGGATC AGACCAAGAG CGACCGGAAA TAG

Protein sequence

MKRLLLATAL FAAPMLAHAA DAPKIDPARL SAHIKVLSSD DFEGRGPATA GETKSVDYIV 
GQMKAIGLEP AGDLKNGTRA WTQDVPLGKF DIKGPVSAQF TIGGKVVPLA QGEQIAIRAA 
MTNVDAVAIK DAPLVFVGYG VKAPERSWDD FKGLDLKGKV LVVLINDPDF ESGAGDFGGK 
AMTYYGRWTY KYEEAARQGA AGVLIVHETA PASYGWATVK NSNTATMFDI VRAAPAKVHP 
NLEAWIQRDV AVDLFKASGL DFDLLKKQAQ GRDFKPVDLK GATFSASYAV DPSVIVSKNI 
AGRIKGSAHP DETVIYSAHW DHLGVGQPDA RGDKIYNGAI DNADGIAAIL ELARAFKSQP 
APQRSILFLA VTAEERGLLG SEYYAANPLY PLSKTVGDLN IDALSATGPA KDITTSGDGK 
VDLQDLLVAK AKAHGRYFTP DPSPQAGHFY RSDHFPFAKR GVPAISVGSG EDLVVGGKEA 
GEKAEADYTA NRYHQPADEW KADWDLTGQA QDIGLFYEIG SDLANSKTWP EWQAGSEFKA 
LRDQTKSDRK