Gene Caul_3669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3669
Symbol	murD
ID	5901124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3963749
End bp	3965158
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	71%
IMG OID	641564180
Product	UDP-N-acetylmuramoyl-L-alanyl-D-glutamate synthetase
Protein accession	YP_001685294
Protein GI	167647631
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0771] UDP-N-acetylmuramoylalanine-D-glutamate ligase
TIGRFAM ID	[TIGR01087] UDP-N-acetylmuramoylalanine--D-glutamate ligase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00445508
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.10958
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCCGG TCCGCGGTTT CGAGGGCAAG ACCGTCGCCG TGTTCGGCCT GGGCCGGACG 
GGGCTGACGG CCGCGCGCGC GCTGATCGCC GGCGGGGCCA AGGTGGCGCT GTGGGACGAA 
AAGCCCGAGA GCCGCCAGGC CGCCGTGGCC GAGGGGCTGA ACGTCGTCGA CCTGACCACC 
AGCGACTGGA GCGACTACGC CGCCCTGATG CTGTCGCCGG GCGTGCCGCT GACCCATCCC 
AAGCCGCACT GGACGGTGGG CAAGGCCAAG GCGGCCGGGG TCGAGGTGCT GGGCGACATC 
GAGCTGTTCG CCCGCACGGT GAACGCCGCG CCCGAGCACA AGAAGCCCAA GATCATCGCC 
ATCACCGGCA CCAACGGCAA GTCGACGACG ACGGCCCTGA TCGGCCATCT GTGCCGCCAG 
GCCGGGCGCG ACACCCGGGT CGGCGGCAAT ATCGGCGAGG GCGTGCTGGG CCTGGAGGAC 
ATGCACGGCG GCGCGGTCTA CGTGCTGGAG CTGTCGTCCT ACCAACTGGA CCTGACCTCC 
AGCCTCAAGC CCGACGCCGT GGTGCTGCTG AACATCTCGC CCGACCACCT GGACCGGCAT 
GGCGGGATGG ACGGCTATAT CGCCGCCAAG CGCCGGATCT TCCTCAACCA GGGCAAGGGC 
GACACGGCGA TCATCGGGGT GGACGATCCC TGGTGCCAGC AGATCTGCAC CGAGATCACC 
GCCGCCAACC GCCGCACCAT CTGGCCGATC AGCGCCGGCA AGGCCATGGG GCGCGGCGTC 
TACGCCCTGC AGGGCGTGCT GTACGACGCG ACCGGCGAGC GCGTGACCGA GATGGCCGAC 
CTGTTGCGGG CCCGCAGCCT GCCAGGCCGT CATAACTGGC AGAACGCCGC GGCCGCCTAC 
GCCGCGGCCA AGGCCATCGG CATTCCCGCC CACCAGGCCG TCGACGGCCT GATGAGCTTC 
CCGGGCCTGG CCCATCGCAT GGAGACGGTC GGCAAGCTGG GCAAGGTCCG CTTCGTCAAC 
GACAGCAAGG CCACCAACGC CGACGCCGCC CGCCAGGCGA TGTCGAGCTA TCCCAAGTTC 
TACTGGATCG CGGGCGGCGT GCCCAAGGCC GGCGGCATAG ACGACCTCGT CGACCTGTTC 
CCGCGCGTGG CCGGAGCCTA TCTGATCGGC CAGGCGGCCG AGGACTTCGG CAAGACGCTT 
GAGGGCAAGG CCCCGGCGCG CCAGTGCGGC GATATCGAGA CCGCTGTCGC CGCCGCCTAT 
GCCGACGCCG TCGCCAGCGG GGAGGAGGCG GTCGTCCTGC TTTCGCCGGC CTGCGCCTCG 
TTCGACCAGT TCGCCGACTT CGAGCAGCGC GGCGAGGCGT TCCGCGCGGC GGTCAACGGA 
TTGGGCAAGC CGGCGGCGAA GCGGGCCTAG

Protein sequence

MIPVRGFEGK TVAVFGLGRT GLTAARALIA GGAKVALWDE KPESRQAAVA EGLNVVDLTT 
SDWSDYAALM LSPGVPLTHP KPHWTVGKAK AAGVEVLGDI ELFARTVNAA PEHKKPKIIA 
ITGTNGKSTT TALIGHLCRQ AGRDTRVGGN IGEGVLGLED MHGGAVYVLE LSSYQLDLTS 
SLKPDAVVLL NISPDHLDRH GGMDGYIAAK RRIFLNQGKG DTAIIGVDDP WCQQICTEIT 
AANRRTIWPI SAGKAMGRGV YALQGVLYDA TGERVTEMAD LLRARSLPGR HNWQNAAAAY 
AAAKAIGIPA HQAVDGLMSF PGLAHRMETV GKLGKVRFVN DSKATNADAA RQAMSSYPKF 
YWIAGGVPKA GGIDDLVDLF PRVAGAYLIG QAAEDFGKTL EGKAPARQCG DIETAVAAAY 
ADAVASGEEA VVLLSPACAS FDQFADFEQR GEAFRAAVNG LGKPAAKRA