Gene Mchl_2042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_2042
Symbol
ID	7118742
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	+
Start bp	2139760
End bp	2141127
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	75%
IMG OID	643524792
Product	cytosine deaminase-like protein
Protein accession	YP_002420817
Protein GI	218530001
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.670818
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAGC CGCCGTTCCT GCCCGAGGCC CACGCCTACC GCCTGCGCGA CGCGCGCGTG 
CCCGGAGCTT TCCTGACGGG CGGCGTGCCG GCCGGCGCGA CACTCGACGG GGACGGCTGC 
GCGCTCCTCG ACATCGTCGT CGCGGACGGC GTCGTCGCCC GTCTCCTGCC GGCCGGGGGG 
ACGCCGGATA CGCTGCCCGC CGCCGATCTC GCCGGGCGGC AGGTCTGGCC CCGCCTCGTC 
GATGCGCATA CCCACCTCGA CAAGGGCCAC ACCGTCGCTC GCACGCCCAA TCCGGCCGGC 
GACTTTCCCG GCGCCCGCGA CGCCACCACG GCGGACCGTA CCCGCCACTG GGACGCGGAG 
GATCTGCGCC GCCGCATGAC CTTCGGCCTC GCCTGCGCCT TCGCGCACGG CACGGGCGCG 
ATCCGCACGC ATCTCGACAG TCAGGAGAGC GGGGAGGGCG CGCCGCGCGA CCAGGCCGCG 
ACGACCTGGG CGGTGTTCCG GGAGATGCGG GCGGCCTGGG CCGGGCGGAT CGCGCTGCAG 
GGCGTCGGCC TGACCCCGAT CGACGCCTAC GCCACCGATT ACGGGCGCCG CCTCGCCGAC 
CTGATCGCCG ATTCGGACGG GCTGATCGGC GGCGTGACCC GGCCGACCGG CGGCCTGCAT 
GGCGGGGCGC TGGCCGAGAT CGACGCCCTG CTCGACCGCC TGTTCGGCCT CGCCCGCGCC 
CGCAACCTCG ATGTGGACCT CCATGTCGAC GAGACCGGCG ATCCCGCGGC GGCCTCCCTC 
GACGCGGTCG CGCGGGCGAC CCTGCGCCAC GGCTACGAGG GCCGCGTCAC CTGCGGGCAT 
TGCTGCAGCC TCGCGCTCCA GCCCGAGGCG CAGGCTTCGG CCACGATCGC GCGGGTCGCG 
CAGGCGGGAA TCCGCATCGT GACGCTGCCG ACCGTCAACA TGTACCTCCA GGACCGGCAG 
CGGGGGCGCA CTCCGCGCTG GCGCGGCGTC GCCCCAGTTC AGGAACTGAT GGCAGCCGGC 
GTGCCCGTGA TGGTCGCGGG CGACAATTGC CGCGACGCGT TCTACGCCTA CGGCGACCAC 
GACATGCTCG ACACATTCCG GGCGTCGGTG CGGATCCTCC ATCTCGATCA TCCACTGGCC 
GGCGCGCCCG CGCTCGCCGG GCCGGTGCCG GGGGCGATGA TGGGGCTCCC CCATGCCGGC 
ACGATCCGCG AGGGCGCCCC CGCCGACCTG ATGCTTCTGG CCGCGCGCAG CCTCAACGAG 
GTCGTCGCGC GGCCGCATGC GGACCGAATC ATCGTGGTCG CGGGCAGGCC CGTCGCGACG 
CGGCTGCCGC CCTACGAGGC CCTGACCGGC GAGGCCGCCC CCTGGTAG

Protein sequence

MSEPPFLPEA HAYRLRDARV PGAFLTGGVP AGATLDGDGC ALLDIVVADG VVARLLPAGG 
TPDTLPAADL AGRQVWPRLV DAHTHLDKGH TVARTPNPAG DFPGARDATT ADRTRHWDAE 
DLRRRMTFGL ACAFAHGTGA IRTHLDSQES GEGAPRDQAA TTWAVFREMR AAWAGRIALQ 
GVGLTPIDAY ATDYGRRLAD LIADSDGLIG GVTRPTGGLH GGALAEIDAL LDRLFGLARA 
RNLDVDLHVD ETGDPAAASL DAVARATLRH GYEGRVTCGH CCSLALQPEA QASATIARVA 
QAGIRIVTLP TVNMYLQDRQ RGRTPRWRGV APVQELMAAG VPVMVAGDNC RDAFYAYGDH 
DMLDTFRASV RILHLDHPLA GAPALAGPVP GAMMGLPHAG TIREGAPADL MLLAARSLNE 
VVARPHADRI IVVAGRPVAT RLPPYEALTG EAAPW