Gene Caul_2579 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2579
Symbol
ID	5900034
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2802483
End bp	2803637
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	67%
IMG OID	641563070
Product	peptidase M23B
Protein accession	YP_001684204
Protein GI	167646541
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGATCA CGCGCTTCAA GCGACTGCGG CAATCCCTGG AAGAGATGTT CCCGGAACGT 
CATCTCTATG TCCGCTCCGG CGGCGAGATG CGCGGCTACG TCTTCTCCAC CGGCAAGCAA 
CTGATCTGCG CCACTGGGAT CGCGGCGGCG GCCCTGTGGA TGGGCGTCTG CACCGCCTCG 
ATGATGGTCA GCGCCCTGTC CGTCAGCTCG ACCGACCAGA TGGTCATCAA GCAGAAGGCC 
TATTACGAGC GGCTCAACGC CGATCGCCAG GCGCGGCTGA ACAGCGCCGT TGCCCAGTTG 
TCGGCCAGCA GCGGCTCGCT CGACGAATTG GCCAGCTCGG TCGAAAAGCG CCATGCCGCC 
CTCGCCATGC TGGTCAGCGA CTTCCGTGGC GTGCCCGGCG CCGCCCAGGC TCTGCAGACC 
GCCAAGCCGC GCTTGCCCGG CGCCTCCCCA GTCGAACGCA TCCAGGCCAC GCGGATGGAT 
CAGGAGCGCC TGATCGACGC GGCCGAGACC TTCGCCAAGA GCCGCGCCGA ACGTTTGCGC 
TTGGCGATGC GGATGGCCGG CCTCGACGCC AGCTCGTTCA CCGGTCGCGC CGGCTCATCG 
CTTGGCGGCC CGCTGATCGA GGCCAAGGAT CCCCGCGCCC TGGCCGCCGT GCTCGACGTC 
GACGAAGACT TCGCCAGCCG CATCCAGCAC GCCGCCACCG ACATGTCGGA CATGCGTCAG 
CTGAGCGCCG CCTCGCAGAA ACTGCCCTTC TACCGGCCGA CCACCAACCC CGCCCTGAGC 
AGCAGCTACG GCGTGCGGTT CGACCCCTTC ACCCATCGTC CCGCCTTCCA CTCCGGCCTC 
GATTTCCCCG GCGCCTTCTA CACGCCGATC ATGGCCACCG CGCCGGGCGT GGTGTCGTTC 
ACCGGCGTCC GCTCGGGTTA CGGCAATGTG GTCGAGATCG ACCACGGCAA CGGTTTCAAG 
ACCCGTTACG CCCACCTGCA GGCCACATCG GTCAAGGTTG GTCAGCGGGT GGCCATCGGT 
CAGCGTATCG CGGCCATGGG CTCGACGGGT CGTTCGACCG GTCCGCATCT GCACTACGAA 
GTATGGGTCA ACGGGCGGGC GCAGAACCCG AACCGTTTCT TGAAGGCTGG TGAGTATGTT 
CAGCAAGCAA GCTAA

Protein sequence

MAITRFKRLR QSLEEMFPER HLYVRSGGEM RGYVFSTGKQ LICATGIAAA ALWMGVCTAS 
MMVSALSVSS TDQMVIKQKA YYERLNADRQ ARLNSAVAQL SASSGSLDEL ASSVEKRHAA 
LAMLVSDFRG VPGAAQALQT AKPRLPGASP VERIQATRMD QERLIDAAET FAKSRAERLR 
LAMRMAGLDA SSFTGRAGSS LGGPLIEAKD PRALAAVLDV DEDFASRIQH AATDMSDMRQ 
LSAASQKLPF YRPTTNPALS SSYGVRFDPF THRPAFHSGL DFPGAFYTPI MATAPGVVSF 
TGVRSGYGNV VEIDHGNGFK TRYAHLQATS VKVGQRVAIG QRIAAMGSTG RSTGPHLHYE 
VWVNGRAQNP NRFLKAGEYV QQAS