Gene Caul_3420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3420
Symbol
ID	5900875
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3695867
End bp	3697498
Gene Length	1632 bp
Protein Length	543 aa
Translation table	11
GC content	69%
IMG OID	641563926
Product	amidase
Protein accession	YP_001685045
Protein GI	167647382
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0154] Asp-tRNAAsn/Glu-tRNAGln amidotransferase A subunit and related amidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.343443
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCCGAA AGACCTTGCT GATTGGCGGC GCGCTGACCG CGCTCGTCCT GGGCGCAACG 
CCGTCGGTCT CAGCGCCGAA GCCAACCTTC GCCGACAAAA AGGCGACCAC GCCCGAGGAA 
TTCCTCAAGT CACTGGGTCC CGCCCCGGGG ACAGGCCAGA CCATCGACTT CGAGGGCGGG 
ACGGTTCTGT TCGGGGCTGA TTCAGCGACC GACAGCGTCT TCGAAAGCCT GACTCTCTAT 
CACGCCCTGA ATCCTCGTAT CCACGCCGTC ATCGCCCTGA ACCCGCACGC CCTGGCCGAC 
GCCCGGGCGC TGGACGCCGA GCGCGAGGCC GGCAAGGTCC GGGGTCCGTT GCACGGCGTG 
CCGATCCTGC TGAAGGACAA TATCGAGAGC GCCGACGGCA CGGCCACCAC CGCCGGCTCC 
CTGGCCCTGA AGGACAATGT CACGGGCCGC GACGCCCCGC TGGTCAAACG GCTGCGCGAC 
GCCGGCATGG TGATCCTGGG CAAGTCCAAC CTGTCGGAAT GGGCCAATAT CCGTTCCGGC 
CACTCGATCA GCGGCTGGAG CGCGGTGGGC GGCACGGTGC GCAACCCCTA TGTGCTGGAC 
CGCAGCGCCT GCGGCTCGTC CAGCGGCTCG GGGGCGGCGG TGGCGGCGGG CTTGGCCCCG 
GCGGCGATCG GCACCGAGAC CGACGGCTCG GTCACCTGCC CCGCCGCGAT CAACGGCCTG 
GTCGGCCTCA AGCCCACGGT CGGCCTGGTG TCGCGCACCC ACATCGTGCC GATCAGCCAC 
AGCCAGGACA CCGCCGGCCC GATGACCCGC ACGGTCCTGG ACGCGGCCCT GATCCTGACC 
GCCATCGCCG GCTCCGATCC CGCCGACGCG GCGACCAAGG AGGCCGACGC CCACAAGACC 
GACTACGCCA AGGGCCTTTC GAAGGACGCC CTGAAGGGCG TGACCCTGGC CGTCGCCCGC 
TTCTACACCG GTTCTTCGCC GGGCACGGAC GCGGTGTTCG AGCAGGCGCT GAAGGACCTC 
AAGGCCCAGG GCGCGACCCT GATCGAGGTC AAGGACTTCG ACGAGGCCCC GATCGGCAAG 
GCCGAGGGCG TGGTGCTCTA CACCGAGCTG AAGGTCGACC TGAACGCCTA CCTGGCCTCG 
ACCGACCCCA TGAAGGTCAA GACCCGCACC CTGGCCGACC TGATCGCCTT CAACAAGGCG 
ACGCCCAAGG AGCTGGAATG GTTCGGCCAG GAAAGCTTCG AGAAGGCCGA GGCCACCAAC 
GGCTATGACG ATCCGGCGTA CATCAAGGCC GCCGCCGACG CCAAGCGCCT GGCCGGTCCC 
GAGGGCATCG ACAAGATCCT GAAGGACACG GGCGCGATCG CCATCGTCGC CCCGACCACC 
GGCCCGGCCT GGACCATCGA CCCGCTGAAC GGCGACCACT ACGGCGGCTC GTCCACCACC 
CTGCCCGCCG TGGCCGGCTA TCCGCACCTG ACCGTGCCGA TGGGCGAGGT CGGCGGCCTG 
CCGGTGGGGC TGAGCTTCAT CGGCCCGGCC TGGAGCGAGG CGCGCTTGCT GGGACTGGGC 
TACGCCTACG AGCAGGCGAC GCACCGGCGG ATCGAGCCGA AGTTTTTGAG CACGGTGAAG 
CCGGAGAAGT AG

Protein sequence

MIRKTLLIGG ALTALVLGAT PSVSAPKPTF ADKKATTPEE FLKSLGPAPG TGQTIDFEGG 
TVLFGADSAT DSVFESLTLY HALNPRIHAV IALNPHALAD ARALDAEREA GKVRGPLHGV 
PILLKDNIES ADGTATTAGS LALKDNVTGR DAPLVKRLRD AGMVILGKSN LSEWANIRSG 
HSISGWSAVG GTVRNPYVLD RSACGSSSGS GAAVAAGLAP AAIGTETDGS VTCPAAINGL 
VGLKPTVGLV SRTHIVPISH SQDTAGPMTR TVLDAALILT AIAGSDPADA ATKEADAHKT 
DYAKGLSKDA LKGVTLAVAR FYTGSSPGTD AVFEQALKDL KAQGATLIEV KDFDEAPIGK 
AEGVVLYTEL KVDLNAYLAS TDPMKVKTRT LADLIAFNKA TPKELEWFGQ ESFEKAEATN 
GYDDPAYIKA AADAKRLAGP EGIDKILKDT GAIAIVAPTT GPAWTIDPLN GDHYGGSSTT 
LPAVAGYPHL TVPMGEVGGL PVGLSFIGPA WSEARLLGLG YAYEQATHRR IEPKFLSTVK 
PEK