Gene Caul_3189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3189
Symbol
ID	5902577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3453850
End bp	3454869
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	74%
IMG OID	641563694
Product	peptidase S58 DmpA
Protein accession	YP_001684814
Protein GI	167647151
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3191] L-aminopeptidase/D-esterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.746127
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCCCTAC CCCGCCCCGG TCCTCGCAAC CTGATCACCG ACGTGCCCGG CCTGACCGTC 
GGTCACGCCA CGGACGAGGC GGTGCGTAGC GGGGTGACCG TCCTGCTCTG CCCAGCCGGT 
TGGGTCGGCG GGGTGGACGT GCGCGGCGGC GGGCCGGGGA TCCGCGAGAG CGACGTGTTG 
CGGCCGGAGA ACAATTTTGG CCGGGTCCAC GCCGTCGCCT TGTCGGGCGG TTCGGTGTTC 
GGCCTGGGCG CGGCGGACGG CGTGACGACG GCGCTGTCGG CGGCGGGCCA TGGCCTGCGG 
CTCGTGGCGG GCTCGCCGGC CATTCCGATT GTGCCGGGCG CGGTGCTGCA CGACCTGGGC 
AATGGCGGCG ACAAGGCCTG GGGCCTGGAT CCGCCCTATC GGGTCCTGGG CGTTGCGGCC 
GTCGCGACGG CCGGCGAGGA CTTCGCCCTG GGCTCGGTCG GGGCCGGACG CGGGGCCATG 
GCGGGCCTGC ACAAGGGCGG CGTCGGTTCG GCCTCGCTGG ACCTGGGCGA CGGCCTGGTG 
GTCGGCGCCC TGGCGGCGGT CAATCCGGTG GGCTCGGTCT ATATGCCGGG GGGCCAGACG 
TTCTGGGCCT GGCCGTTCGA GATCGACGGC GAGTTTGGCG GCAAGGCGCC GGATCCATCA 
GCCAGGGCCG TCGATCCCGT GCCCGACGAC AGCAAGCTGG CGACCCGGCT CAAGGCCGGG 
GCCAACACCA CCCTGGCCGT GATCGCGACC ACCGCCGCCC TGACCACCGC GGAGGCCACT 
CGGCTGGCGA TGATGGCCCA GGACGGCCTG GCCCGCGCCA TCCGCCCCGT TCATACCCCG 
TTCGACGGCG ACGTGGTCTT CGCCCTCTCC TCGGGCGCGG TCGAGATCGG CGAGGGTCCG 
GCACGGTCGT TGACGATCGC GCGGCTGGGT TCGGCGGCGG CCGACACCCT GGCCCGGGCG 
ATCGCGCGCG GCGTCTATTC GGCGCGTTCG GATCCCGGCG GCGCGGTGTC GGCCCCGTAG

Protein sequence

MPLPRPGPRN LITDVPGLTV GHATDEAVRS GVTVLLCPAG WVGGVDVRGG GPGIRESDVL 
RPENNFGRVH AVALSGGSVF GLGAADGVTT ALSAAGHGLR LVAGSPAIPI VPGAVLHDLG 
NGGDKAWGLD PPYRVLGVAA VATAGEDFAL GSVGAGRGAM AGLHKGGVGS ASLDLGDGLV 
VGALAAVNPV GSVYMPGGQT FWAWPFEIDG EFGGKAPDPS ARAVDPVPDD SKLATRLKAG 
ANTTLAVIAT TAALTTAEAT RLAMMAQDGL ARAIRPVHTP FDGDVVFALS SGAVEIGEGP 
ARSLTIARLG SAAADTLARA IARGVYSARS DPGGAVSAP