Gene Caci_0251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_0251
Symbol
ID	8331578
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	281646
End bp	283079
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	70%
IMG OID	644953418
Product	N-formimino-L-glutamate deiminase
Protein accession	YP_003111045
Protein GI	256389481
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02022] formiminoglutamate deiminase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.421015
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTTCCT CCGAGAACCC GCAGACCGCG ACCACGATCC CGGCCACTAC TCCCTCCCCG 
AACGGCGGCG CCGCCAGCGC CGGCGCCGAC CGGCGCGCGT TCTGGTGCGA ACTCGCCTGG 
ATCAACGGCG AGATCAAGAG CAAGGTCCTC ATCGAGGTCG CCGGCGGGCA GATCTCCGCG 
GTCACCTGCG GCGTGAAACC CCGCCCCCAG AACGCCGAGA AACTGACCGG CCTGACCATC 
CCGGGCCTGG CGAACGTCCA CTCCCACGCC TTCCACCGAG CCCTGCGCGG CCGCACCCAG 
ATCGAGTCCG GCACCTTCTG GACCTGGCGC GAACGCATGT ACGCCGCCGC CGCGCACCTG 
GACCCGGACT CCTACCGCGA ACTGGCCACC GCGGTCTTCG CGGAGATGGC ACTGGCCGGC 
GTCACAGCCG TCGGGGAGTT CCACTACGTA CACCACTCGC CCAAGGGCGG CCTGTATCAG 
GACCCGAACG CCATGGGCCA CGCCCTGACC GAGGCCGCCG AGGCCGCGGG CATCCGCATC 
ACCCTGCTGG ACACGTGCTA CCTGTCCGGC GGCTTCGACA ACGAACTGAA CGACGTCCAG 
CGGCGCTTCT CCGACGGCGA CGCCGGCCGC TGGGCCGAAC GCGTCGAGGC ACTCCGCAAG 
GCTTATGCGG GCTCTGACAC GGTACGCATC GGCGCGGCGG TGCACAGCGT CCGCGCCGTC 
CCCGTCGATC AGCTCTCCCC GGTGGTGGCC TTCGCGGCGG AGAACGAAAT GCCCCTGCAC 
GTCCACCTGT CCGAGCAGCG CGCGGAGAAC GACGCCTGCC TGGCCCGCCA CCACAAGACC 
CCCACCGAAC TCCTGCACGC CCACGGCGCC CTCGGCCCGC GCACCACCGC CGTCCACGCC 
ACACACCTGT CCCAAATGGA CATCGACCTC CTCGGCACCT CCGCCACGGC GGTCTGCATG 
TGCCCCACCA CCGAACGCGA CCTGGCCGAC GGCATCGGCC CAGCCCACGC AGTCCACCTC 
GCAGGCTCCC CCGTCAACCT GGGCACCGAC TCCCACGCCA TGATCGACCT CTTCGAAGAA 
GCCCGAGCCG TAGAACTCGA CGAACGCCTC CGCACCGAAC GCCGAGGCCA CTGGCTAGCC 
TCCGAACTCC TCCAAGCCGC CACCACCGAC GGCCACGCCT CCCTAGGCTG GCCCACCACA 
GGCCGCCTGC AACCCGGCAC CCCCGCCGAC TTCACCACCA TCGCCCTCGA CACCGTCCGC 
CTAGCCGGCG TCCAACCCGC CCACGCCGCC GAATCAGTGA TCTTCGCCGC CACCGCCGCC 
GACGTCCGCC ACGTCGTGGT CGCCGGTAAG TTCACGGTCC GCGACCATCA GCACATGCTG 
GTCGACGACG TGCCGGGACG CCTGGCCGCG ACGATCGGGG CGATCTTCAA GTAG

Protein sequence

MTSSENPQTA TTIPATTPSP NGGAASAGAD RRAFWCELAW INGEIKSKVL IEVAGGQISA 
VTCGVKPRPQ NAEKLTGLTI PGLANVHSHA FHRALRGRTQ IESGTFWTWR ERMYAAAAHL 
DPDSYRELAT AVFAEMALAG VTAVGEFHYV HHSPKGGLYQ DPNAMGHALT EAAEAAGIRI 
TLLDTCYLSG GFDNELNDVQ RRFSDGDAGR WAERVEALRK AYAGSDTVRI GAAVHSVRAV 
PVDQLSPVVA FAAENEMPLH VHLSEQRAEN DACLARHHKT PTELLHAHGA LGPRTTAVHA 
THLSQMDIDL LGTSATAVCM CPTTERDLAD GIGPAHAVHL AGSPVNLGTD SHAMIDLFEE 
ARAVELDERL RTERRGHWLA SELLQAATTD GHASLGWPTT GRLQPGTPAD FTTIALDTVR 
LAGVQPAHAA ESVIFAATAA DVRHVVVAGK FTVRDHQHML VDDVPGRLAA TIGAIFK