Gene Caci_4726 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4726
Symbol
ID	8336080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	5390698
End bp	5392029
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	70%
IMG OID	644957826
Product	allantoinase
Protein accession	YP_003115428
Protein GI	256393864
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type [TIGR03178] allantoinase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.16823
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGGGC CCTTCGATCT CGTTCTGCGT TCGACGCGTG CTGTGCTGCC TGATGGTGTG 
CGGCCTGCTG CCGTTGCGGT TCGGCGTGGG CGTATTGCGG AGGTCGGCGA TCATCGGGCT 
GCTTTCGGTG CGCGCGTTGA TCTCGATCTC GCCGATACCG CGTTGCTGCC CGGGTTGGTG 
GATACGCACG TCCACGTCAA CGAGCCGGGC CGGACGCGCT GGGAGGGCTT CGCCTCCGCG 
ACGCGTGCGG CGGCGGCGGG GGGTGTCACG ACACTGATCG ACATGCCGCT CAACTCGATT 
CCGCCGACGG TGGATGTGCC GGCGTTGGCG GTCAAGCGGA AGGCGGCTGA GGGGAAGTGC 
TTCGTCGATG TCGGGTTCTG GGGTGGTGCG ATTCCCGGTA ATGGCGCGGC GTTGCGTCCG 
TTGCATCGCA GTGGGGTGTT CGGGTTCAAG TGCTTCCTTG CCGATTCCGG GGTTGAGGAG 
TTTCCCGAGC TCAGTGTCGC GGAAATGCGG CTGGCAATGC GGGAGATCGC GCGGTTCGGC 
GGACTTCTCA TCGTGCATGC CGAAAACGCC GAAGCGCTCG GTGCCGCGCC TTCCAGTGTC 
CGCTATCGCG ATTTCCTCGC CTCGCGTCCG GCGGTGGCTG AGGACAGTGC CATCGCCGAT 
GTCATCGATG CCGCCCGGGC CTACCGCGCG CGTGTCCACA TCCTGCATCT CGCCGCTGCC 
GAAGCGTTGC CGCGGCTGGC CGCTGCCAAG GCGGACGGCG TGCGCATCAG CGCCGAGACG 
TGCCCGCACT ACCTCACCTT CAGCGCCGAC GAGATCCGGG ACGGCGCCAC GCAGTTCAAG 
TGCTGCCCGC CGATCCGGGA CGCCGCCGAC CGGGAGGCGT TGTGGGCGGC GCTCGCCGAC 
GGCTTGATCG ACGTCGTCGT GTCCGACCAC TCGCCCTCCA CGCCCGACCT CAAGCGCCTG 
GACTCCGGCG ACTTCGGCGC GGCGTGGGGC GGGATCTCCT CGCTCCAGCT CGGGCTGGCG 
GCGGTGTGGA CCGGTGCGCG GGCGCGCGGG TTCGGGCTGG CCGACGTCGC GCGCTGGATG 
GCCGCGCGTC CCGCCGAGCT GGTCGGGCTG GCGGGCAAGG GCCGCATCGC CGTGGGCTAC 
GACGCCGACC TGGTGGCCTT CGACCCCGAA GCGGCCTTCA CCGTCGACCC CGCGAACCTG 
CACCACAAGA ACCCTGTCAC GCCCTACGCC GGACGCGAGT TGCACGGCGT CGTGCGTGCC 
ACCTACCTGC GCGGCGAGCC GGTGACCGAC GTCCCGCGCG GAGGATTCCT CACGCACCCG 
GAGGTCCGAT GA

Protein sequence

MSGPFDLVLR STRAVLPDGV RPAAVAVRRG RIAEVGDHRA AFGARVDLDL ADTALLPGLV 
DTHVHVNEPG RTRWEGFASA TRAAAAGGVT TLIDMPLNSI PPTVDVPALA VKRKAAEGKC 
FVDVGFWGGA IPGNGAALRP LHRSGVFGFK CFLADSGVEE FPELSVAEMR LAMREIARFG 
GLLIVHAENA EALGAAPSSV RYRDFLASRP AVAEDSAIAD VIDAARAYRA RVHILHLAAA 
EALPRLAAAK ADGVRISAET CPHYLTFSAD EIRDGATQFK CCPPIRDAAD REALWAALAD 
GLIDVVVSDH SPSTPDLKRL DSGDFGAAWG GISSLQLGLA AVWTGARARG FGLADVARWM 
AARPAELVGL AGKGRIAVGY DADLVAFDPE AAFTVDPANL HHKNPVTPYA GRELHGVVRA 
TYLRGEPVTD VPRGGFLTHP EVR