Gene Caul_3620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3620
Symbol
ID	5901075
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3908007
End bp	3909428
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	65%
IMG OID	641564131
Product	amidase
Protein accession	YP_001685245
Protein GI	167647582
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0154] Asp-tRNAAsn/Glu-tRNAGln amidotransferase A subunit and related amidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTTCT TGCAACTCGA CGCGGTCGAT CAGATCGAGG CCTTGGCCCG CAGTCAGATC 
ACGGCCGTGC GCGCACTTGA ATTGGCCGTG GAGCGAGCTG ACGCTCTTCA AGCTAGGGTG 
AATGCAGTCA CGTCCCGGCG GATTGGGGCC GCTCGCGCCG AAGCGCAAGC TATTGATGAG 
GCGCGGCAGC GAGGCCAAAA GCTGGGCCGT CTGGCCGGCC TGCCCATGAC GGTAAAGGAC 
ACCCTGGATA TTGAAGGTCT GCCCGCCTCG GCCGGGCGGA TGGATCTGAC GAACCGGCAA 
GTGCATGACG CGGAGGTCGT GCGCCGCGTG CGGAGCGAAG GCGCAGTGGT CTGGGGTCAC 
ACCAACACGC CGGTCAATGC CGGCGACTGG CAAACGCATA ACAAGCTCTA TGGCGTTACC 
CGAAATCCAT GGAACGAGGC GCTGACCTGC GGCGGCTCGT CAGGCGGATC AGCGGCGGCG 
CTGGCGGCCG GCATTTCGGC CCTGGAGATT GGCGCCGACA TCGCCGGTTC CCTGCGTATC 
CCCGCCAGCC TGTGCGGTGT CATGGCCTTG AAGCCGACCT TTGGCCTGAT CTCACAGGCT 
GGTCTCGTAC CGCCGGCTGA GGGCGAGCTG GACATGGCCG TGGTCGGCCC AATGGCGCGC 
AGCGCCCGAG ACCTGGCGCT GTTGTTCTCT ATTTTGACCG AGGCTCCGGC CACCACCGGC 
GTATCCGTAC CGCTACGCGG GTTACGCGCT GGGCTGTGGC TGGACGAATC AGGATTTGCG 
ACGGATCTCG AAATTCGCCG CAGTGCCGAG CGGTTCGCCG AGACCTTACG GGATGAGGGC 
GCCCGTGTGG AGGCTTGCCG TGGACCCATC GGGGGCGAGG CCATCCTGGA GACCTACACA 
TCCTTGATCT ACCCGCTGCT CTGGGCGAAC GCGCCGCGCA GCGAGCTTGC CGTCTATCGC 
GCTCTGCGGT TGCCAGCGAA GCTTGCGCGA CGCCTGGGCG CCGGGCCGTT GAGCTGGGCC 
AAGGGTGTAC TGGCGGCTAC AAGTAGCGCC GCCGAGCAAC GGCGGGCTCA AGTCGAGCGG 
CTGCGCCTGG CGGCTGACGT TCAGACCTTC TTTGAGCAGT TCGACGTCCT GATCGCGCCA 
ACCGCCCCGA CGCCAGCCTT CCCTCATGAC CACCGGTCGA TCCATCTGAG GCGGCTGAAG 
CTGACCGACG GCAGAAAGAC GAGCTACTTG CAGATGATGG CTTGGCCGGC TCTGGCCAGC 
GTTTGGAAAT TGCCCGCATT GGCCTTTCCC ATCGGGCTGT CGCGGGACGG TCTCCCCATC 
GGCGTGCAGC TCATGGGGCG GCCAGGAAGC GACACGTTCC TGCTTGACCT TGCGCAGACG 
CTTGAAGCCC GGCTGGGCGG CTTCCAGTTT CCGCAGGGAT GA

Protein sequence

MDFLQLDAVD QIEALARSQI TAVRALELAV ERADALQARV NAVTSRRIGA ARAEAQAIDE 
ARQRGQKLGR LAGLPMTVKD TLDIEGLPAS AGRMDLTNRQ VHDAEVVRRV RSEGAVVWGH 
TNTPVNAGDW QTHNKLYGVT RNPWNEALTC GGSSGGSAAA LAAGISALEI GADIAGSLRI 
PASLCGVMAL KPTFGLISQA GLVPPAEGEL DMAVVGPMAR SARDLALLFS ILTEAPATTG 
VSVPLRGLRA GLWLDESGFA TDLEIRRSAE RFAETLRDEG ARVEACRGPI GGEAILETYT 
SLIYPLLWAN APRSELAVYR ALRLPAKLAR RLGAGPLSWA KGVLAATSSA AEQRRAQVER 
LRLAADVQTF FEQFDVLIAP TAPTPAFPHD HRSIHLRRLK LTDGRKTSYL QMMAWPALAS 
VWKLPALAFP IGLSRDGLPI GVQLMGRPGS DTFLLDLAQT LEARLGGFQF PQG