Gene M446_0933 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_0933
Symbol
ID	6131978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	1055240
End bp	1056538
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	74%
IMG OID	641641242
Product	cytosine deaminase
Protein accession	YP_001767916
Protein GI	170739261
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.253377
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACATCG ACCTCATCCT GCGCCGCGCG ACCCTGCCGG ACGGGCGCCG GGACCACGAC 
ATCGCGGTCG CGGGCGGGCG GATCGTCGGG ATCGCGCCGG GCATCCCGGG CCCGGCCGGC 
GAGGAGATCG ACGCGGCCGG CCAGCTCGTG ACGCCGCCCT TCGTCGATTG CCACTTCCAC 
ATGGACGCGA CGCTCTCCCT CGGGCACCCG CGCCTCAACC TGTCCGGCAC GCTCCTCGAA 
GGCATCGCCC TCTGGGGCGA GCTGAAGCCG CTCCTCACCG AGGAGGCGGT GATCGCGCGG 
GCGCTGCGCT ACTGCGACCT CGCGGTGGCG CAGGGGCTGC TCGCGGTGCG CTCCCACGTC 
GACGTCTGCG ACGACCGGCT GCTCGCGGTC GACGCCCTGC TCGCCGTCAA GAAGCAGGTC 
GCGCCGTACC TCGACCTCCA GCTCGTCGCC TTCCCGCAGG ACGGCTATCT GCGCGCGCCC 
GGCGCGGCGC GCAACCTGGA GCGCGCCCTC GACCGCGGCG TCGAGGTGGT GGGCGGCATC 
CCGCATTTCG AGCGCACCGC GGAGGAGGGG GCCGAATCCC TGCGCCGCCT GTGCCGGATC 
GCGGCGGAGC GGGGGCTGCG CGTCGACATC CACTGCGACG AGACTGACGA TCCCCTGTCG 
CGCCACGTCG AGACGCTCGC CGCCGAGACG GTGCGGCACG GGCTGCAGGG GCGGGTGGCG 
GGCTCGCACC TCACCTCCAT GCACTCGATG GACAATTACT ACGTCTCGAA GCTGCTGCCC 
CTGATGGCGG AGGCGCAGCT GCGGGTGGTG GCGAACCCGC TCATCAACAT CGTGCTCCAG 
GGCCGGCACG ACAGCTACCC GAAGCGCCGC GGCCTCACCC GCGTGCCCGA GGCGCTGGCG 
GCGGGGCTCA CCGTCGCCTT CGGCCAGGAT TGCTGCATGG ACCCCTGGTA CAGCCTCGGC 
GCGGCCGACA TGCTCGACGT CGCCCATATG GGCCTGCACG TGGCGCAGAT GACCGGGCGC 
GAAGCGATGC GGGCCTGCTT CGCGGCCGTG ACGACCCAGG CCGCCGCCGT GATGGGGCTT 
GAGGATTATG GGCTGCATGT CGGCGCCCAC GCGGATCTGG TGCTGCTGCA GGCCCGCGAC 
CCGATCGAGG CGATCCGGCT GCGCGCGACG CGGCTCGCGG TGATCCGCCG CGGCCGGGTG 
GTGGCCCGCA CCCCCGCCCG GGCGGCCGCC CTCGCCCTGC CGGGACGGCC CGAGCGGGTC 
GATCCGGCGG CCTACGCGCC GGAGGCGGCC GGGGCGTAG

Protein sequence

MDIDLILRRA TLPDGRRDHD IAVAGGRIVG IAPGIPGPAG EEIDAAGQLV TPPFVDCHFH 
MDATLSLGHP RLNLSGTLLE GIALWGELKP LLTEEAVIAR ALRYCDLAVA QGLLAVRSHV 
DVCDDRLLAV DALLAVKKQV APYLDLQLVA FPQDGYLRAP GAARNLERAL DRGVEVVGGI 
PHFERTAEEG AESLRRLCRI AAERGLRVDI HCDETDDPLS RHVETLAAET VRHGLQGRVA 
GSHLTSMHSM DNYYVSKLLP LMAEAQLRVV ANPLINIVLQ GRHDSYPKRR GLTRVPEALA 
AGLTVAFGQD CCMDPWYSLG AADMLDVAHM GLHVAQMTGR EAMRACFAAV TTQAAAVMGL 
EDYGLHVGAH ADLVLLQARD PIEAIRLRAT RLAVIRRGRV VARTPARAAA LALPGRPERV 
DPAAYAPEAA GA