Gene Caul_3404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3404
Symbol
ID	5900859
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3677702
End bp	3678697
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	71%
IMG OID	641563910
Product	D-alanine--D-alanine ligase
Protein accession	YP_001685029
Protein GI	167647366
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1181] D-alanine-D-alanine ligase and related ATP-grasp enzymes
TIGRFAM ID	[TIGR01205] D-alanine--D-alanine ligase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.115962
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00803245
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCGCACCA CCATCCTCTT CGGCGGCACG AGCCGCGAGC GCCTCGTTTC GGTGGCCAGC 
GCCAAGGCCC TGGCCACGGC CCTGCCGGAC GCCGACCTGT GGTTCTGGGC GCCGGACGAC 
AAGGTCTATG TCGCCAGCGA CGCCGTGCTG CAGGCCCACG CGCGGCCGTT CGAGATCGAC 
CTGCCCACAG AAGGGGCGGC GATCGGCGGC ATCGAAGCCG CGCTCGACAA GGCCAAGGCC 
GAGGAGCGCG TGCTGGTCCT GGGCATGCAC GGCGGCGCGG CCGAGAACGG CGACCTGGCG 
GCCCTGTGCG AGGCGCGCGG CGTGGCCTTC ACCGGTTCGG ACAGCCGGTC CAGTCGCCTG 
GCCTTCGACA AGATCGCCAC CAAGGCCGCC GTGGCCAAGG CCGGCGTCGT CGCGCCCTCG 
ACGGTCGAGT TGGCCGACGC GGAAGCCGCC CTGGCCAAGT ATGGCAAGCT GGTCGCCAAG 
CCGGTGGCCG ACGGCTCCAG CTACGGCCTG ATCTTCGTCA ACGGTCCGGC TGACCTCGAG 
ACGCTGGCCG CCGCCGCCGG CCGCGAGGCC TATGTCATCG AGCCGTTCGT GGCGGGCGCC 
GAGGCCACCT GCGGGGTGCT GGAGCAGGAC GGCAAGGTCT TCGCCCTGCC GCCGGTCGAG 
ATCCGCCCGG CCGACGGCGC GTTCGACTAT GTCGGCAAGT ACCTGTCCAA GACCACGGAG 
GAGATCTGCC CGGCCACCTT CGCGCCGGCG GTCAACGCCG CCATGCAGGA GGCCGCGCTG 
AAGGCCCACA AGACCGTGGG CGCCGGCGGA TATTCCCGCA GCGACTTCAT CGTCACCCCC 
AACGGCCCGA TCTTCCTGGA GATCAACACC TTGCCGGGCA TGACCGCCGC CTCGCTGTAT 
CCCAAGTCGC TGAAGGCCCA GGGCATCGCG TTCAAGGACT TCCTGGACGG CCAGATCGCC 
CTGGCGGTCG CCCGCGCCAA GGCCGAGGCG GCCTGA

Protein sequence

MRTTILFGGT SRERLVSVAS AKALATALPD ADLWFWAPDD KVYVASDAVL QAHARPFEID 
LPTEGAAIGG IEAALDKAKA EERVLVLGMH GGAAENGDLA ALCEARGVAF TGSDSRSSRL 
AFDKIATKAA VAKAGVVAPS TVELADAEAA LAKYGKLVAK PVADGSSYGL IFVNGPADLE 
TLAAAAGREA YVIEPFVAGA EATCGVLEQD GKVFALPPVE IRPADGAFDY VGKYLSKTTE 
EICPATFAPA VNAAMQEAAL KAHKTVGAGG YSRSDFIVTP NGPIFLEINT LPGMTAASLY 
PKSLKAQGIA FKDFLDGQIA LAVARAKAEA A