Gene Caul_1130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1130
Symbol
ID	5898585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1196651
End bp	1198150
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	70%
IMG OID	641561612
Product	N-acyl-D-glutamate deacylase
Protein accession	YP_001682758
Protein GI	167645095
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3653] N-acyl-D-aspartate/D-glutamate deacylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000145932
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTCCTGG CGTCCACGGC GCTGGCTTCC ACCCTGATCG TGGGCGCCAA GGTGGTGGAC 
GGCTCCGGCG GACCGGCGCG CTCTGTTAGT GTCAGGATCG ATGGCGAACG CATCGCCGGC 
GTCGGCGTCC TGACGCCCAC GCCGGGCGAA AGGGTGATCG ACGCCAGGGG CTTGGTCCTG 
GCGCCCGGCT TCATCGACGC TCACAGCCAT CACGACCGCG AGGCCGACAA GACGCCGGAC 
CTGACCGCGG TCACCGCCCA GGGCGTGACG ACCATCGTCG TGGGCCAGGA TGGCGAATCC 
AGCTTTCCGC TGAAGACCTA TTTCGAGGGT CTGGCCAAGG CGCCCCTGGC GGTCAATGTC 
GCCTCCTACA CCGGCCACGG CACGCTGCGC GGGCGGGCCA TGGGGACCGA CTACAAGCGC 
CCCGCCACAC CGGACGAGAT CGCCGCCATG CAGGCCGAAC TCACCGCCGA CCTGGCCGAA 
GGCTCGCTGG GCCTGTCCAC CGGGTTGGAA TACGACCCAG GCATCTACGG GACCAAGGCC 
GAGGTCATGG CCCTGGCCAA GACGACGTCC GCGGGGCGCG GCCGCTATAT CAGCCACCTG 
CGCAGCGAGG ACGTGAAGCT GGACGAGGCC ATCGACGAGA TCATCGCGAT CGGCCGCGAG 
GCCAGGCTGC CGGTGGAGAT TTCCCACCTC AAGATCGCGA TCGTCGACCG CTGGGGGCAG 
GCGGGGCAGA TTCTGGCCAA GCTGGATGCG GCCCGCGCGC AGGGCGTGGA CATCACCGCC 
GACGTCTATC CGTATGAGTA TTGGCAGAGC AACCTGGCGG TGCTGCTGCC CGAGCGGAAT 
TTCGAGGACC TGGCCGCCGC GCGGTTCGCC CTGACCAAGC TGACGACGCC CGCGGGCCTG 
CGCCTGGCGG TGTTCGCGCC CGACCCTTCG CTGGTCGGCA AGACCGTCGC CGACATCGCG 
GCCGACCGTC GCGCCGATCC GGCGGAGACC TACCTGGCGC TGACCCGGCA ATCGGAGGCC 
TTCCATCTGG CGCATCCCGA GGTCGAGCGC GTGGACGCGG TGATCGGCAC GGCCATGACC 
GGCGCCGACA TCGACGCCTT CATCGGCTGG GACCATTCGG TGATCTGTTC GGACGGCATG 
TCGCACGGCC TGCACCCCCG TGGCTTCGGG GCCTTCGCCA AGATCCTGCG GGTCTATGTG 
CGCGAGAAGC GGACGCTGTC CCTGGAGCAG GCCGTGCGCA AGATGAGCGC CCAGACCGCC 
GACCAACTGG GGATCGCCGA GCGTGGCGCG ATCAAGCCGG GCAATTTCGC CGATCTGGTC 
CTGTTCGACG CCGCGACCAT CGCGGACCGT TCGGATGTCT CACACCCCAA CGCCCTGGCC 
ACGGGCGTGG CGCGGGTTTG GGTCAATGGC GCGGTGGTCT TCGAGACTGG CCGCGCCACG 
GGCGCCCGAC CCGGGCGCGT CGTGCGCAGA GGCGGCTCGG ACAGCGCGCC AAGGCGCTAG

Protein sequence

MLLASTALAS TLIVGAKVVD GSGGPARSVS VRIDGERIAG VGVLTPTPGE RVIDARGLVL 
APGFIDAHSH HDREADKTPD LTAVTAQGVT TIVVGQDGES SFPLKTYFEG LAKAPLAVNV 
ASYTGHGTLR GRAMGTDYKR PATPDEIAAM QAELTADLAE GSLGLSTGLE YDPGIYGTKA 
EVMALAKTTS AGRGRYISHL RSEDVKLDEA IDEIIAIGRE ARLPVEISHL KIAIVDRWGQ 
AGQILAKLDA ARAQGVDITA DVYPYEYWQS NLAVLLPERN FEDLAAARFA LTKLTTPAGL 
RLAVFAPDPS LVGKTVADIA ADRRADPAET YLALTRQSEA FHLAHPEVER VDAVIGTAMT 
GADIDAFIGW DHSVICSDGM SHGLHPRGFG AFAKILRVYV REKRTLSLEQ AVRKMSAQTA 
DQLGIAERGA IKPGNFADLV LFDAATIADR SDVSHPNALA TGVARVWVNG AVVFETGRAT 
GARPGRVVRR GGSDSAPRR