Gene Caci_4725 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4725
Symbol
ID	8336079
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	5389661
End bp	5390701
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	71%
IMG OID	644957825
Product	allantoicase
Protein accession	YP_003115427
Protein GI	256393863
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG4266] Allantoicase
TIGRFAM ID	[TIGR02961] allantoicase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0172758
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACA CCCCGTCCTT CACCCAGCTG ACCGACCTCG CCGCCCGGGA CGTCGGAGGC 
GCCGTGGTCT GGGCCAACGA CGAGTTCTTC GGCGAGAAGG AATCGCTGAT CCGCCCCGAA 
CCGCCGACTT TCTCACCCGC CACCTTCGGC CACAAAGGCC AGGTCGTCGA CGGCTGGGAG 
ACCCGCCGCA GACGCCCCGG CGGACCCGGA GTCGAGGGCA CGGAGCACGA CTCGGCGATC 
GTCCGGCTCG GCCTTCCTGG CGTCATCCGC GGCGTCACCA TCGACACCGC CTTCTTCCTC 
GGCAACTACC CGCCCCACGC CCGCGTCGAA GCAGCGAGCG TCCCCGGCTT CCCGACTCCG 
GCGGACCTGC TGGCCGCCGA GTGGACCGAG ATCGTCCCGA CCAGCCCGCT GTCCGGCGGC 
TCCGAGCAGC ACTTCGAGGC GGAGATCACC GGCCGCCGCT TCACCCACGT CCGCCTCGCC 
ATGATCCCCG ACGGCGGCAT AGCCCGCTTC CGCGTCTACG GCGAAGCCGT CCCCGACCCC 
GTCTTCCTCG CCGGTGTCCC CGTCGATCTC GCCGCCCTGA CCAACGGCGC GCGCATCGTG 
GCCGCCTCCA ACATGTTCTT CTCCGCGCCC GAGAACCTGA TCAAACCGGC CGAGTCCCGC 
GTCATGGGCG AAGGCTGGGA GACCGCGCGC CGCCGCGACG ACGCCGGCGA CTGGATAGAG 
GTACGCCTGG TCGCGCAAGG CGTCCCGGCC GTCATCGAGA TCGATACCGC CAACTACAAG 
GGCAACGCCC CAGATCACAT CGTCCTGCTC GGTGCGGATC GCCCAGGCCA GGAAGCGGGC 
TCGAACTGGT TCGAGGTCAT CGCGCAGACC CGCATGCTCC CCGACTACAA GCACCGCTTC 
CGGCTCGAAG GCGCGCGCCC CGTCACGCAC CTGCGCCTGG AAGTACGTCC CGACGGGGGA 
GTGGCACGCC TGCGCGCCTT CGGCAGCCTC ACCGACGCCG GCCTGACCGC CGTCCGCACT 
CGCTGGGCGG AGCACGCATA G

Protein sequence

MSDTPSFTQL TDLAARDVGG AVVWANDEFF GEKESLIRPE PPTFSPATFG HKGQVVDGWE 
TRRRRPGGPG VEGTEHDSAI VRLGLPGVIR GVTIDTAFFL GNYPPHARVE AASVPGFPTP 
ADLLAAEWTE IVPTSPLSGG SEQHFEAEIT GRRFTHVRLA MIPDGGIARF RVYGEAVPDP 
VFLAGVPVDL AALTNGARIV AASNMFFSAP ENLIKPAESR VMGEGWETAR RRDDAGDWIE 
VRLVAQGVPA VIEIDTANYK GNAPDHIVLL GADRPGQEAG SNWFEVIAQT RMLPDYKHRF 
RLEGARPVTH LRLEVRPDGG VARLRAFGSL TDAGLTAVRT RWAEHA