Gene Mext_0372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_0372
Symbol
ID	5835646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	414999
End bp	416117
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	71%
IMG OID	641366156
Product	2'-deoxycytidine 5'-triphosphate deaminase
Protein accession	YP_001637865
Protein GI	163849822
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0717] Deoxycytidine deaminase
TIGRFAM ID	[TIGR02274] deoxycytidine triphosphate deaminase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.423524
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGAG ACGTGCCGGC CGCATCCGGT ATCCTGCCGG CGCAGGCCAT CACGGCGCTG 
ACGCAAGCCG GGGCGATCCG CCCCGCGACC GCCTATGCCG CCGACCAGAT CCAGCCCGCC 
AGCCTGGACC TGCGGCTCGG CCGCCGCGCC TATCGGGTGC GCACGAGCTT CCTGCCCGGC 
AGCGGGCGCT CGGTGGCGAC CTGCGTCGAG GCCTTCGCGC TGCACGAGAT CGACCTGACG 
CAAGGCGCCG TGCTGGAGAC AGGCTGCGTC TACATCGCCG AATTGCAGGA AACCCTGGCG 
CTCCCCCCCG ATCTCAGCGC CAGCGCTAAC CCCAAAAGCT CGACCGGGCG CATCGACGTG 
TTCACCCGCG TCATCACCGA CCGCGCCAGC GCCTTCGACC AGATCGAGGC GGGCTATGCC 
GGTCAGCTCT ACGCCGAGAT CTCACCGCGA ACCTTCCCGG TGCGGGTGCG GACCGGCTCG 
CGCCTGTCGC AGATCCGCTT CCGCCAAGGT GACCCGCGGC TGCGGGAGAC GGAACTGGCC 
GCGCTCCACG CCAGCGACCC GCTGATCGAT GCCGCAACCC CCTCGCTTCA GGGCGGCGTG 
CCGGTCTCGG TCGATCTCGC AGGCTTCGAG GGGCTGATCG GCTACCGGGC CAAGCGCCAT 
ACCGGCTTGA TCGACGTGGA CCGGCCGCGC GGGCACCGCA CCCGTGACTT CTGGGAGCCG 
CTGCCGGCCG ACGGCAGCCG CACGCTGATC CTCGATCCCG GCCAGTTCTA CATCCTGGCC 
TCGAAGGAGG CGGTGCGGGT GCCGGCCGAC TACGCCGCCG AGATGGTGCC GTTCGATCCC 
CTCGTCGGCG AGTTCCGCGT CCACTATGCC GGCTTCTTCG ATCCGGGCTT CGGCCTCAGT 
GAAGCGGGCG GGGCTGGCGC CCGCGCGGTG CTGGAGGTTC GCTCGCGCGA CGTGCCGTTC 
CTCTTGGAAG ACGGCCAGAT CGTCGGCCGC CTCGTCTACG AGCGCATGCT GGAGCGGCCC 
GCGACCCTCT ACGGCGCGGG CGCCGGTTCG AACTATCAGG CGCAAGGCCT GAAGCTCTCG 
AAGCATTTCG CCAGCGAGCC GGAGCCGCCC GCGGCCTGA

Protein sequence

MSGDVPAASG ILPAQAITAL TQAGAIRPAT AYAADQIQPA SLDLRLGRRA YRVRTSFLPG 
SGRSVATCVE AFALHEIDLT QGAVLETGCV YIAELQETLA LPPDLSASAN PKSSTGRIDV 
FTRVITDRAS AFDQIEAGYA GQLYAEISPR TFPVRVRTGS RLSQIRFRQG DPRLRETELA 
ALHASDPLID AATPSLQGGV PVSVDLAGFE GLIGYRAKRH TGLIDVDRPR GHRTRDFWEP 
LPADGSRTLI LDPGQFYILA SKEAVRVPAD YAAEMVPFDP LVGEFRVHYA GFFDPGFGLS 
EAGGAGARAV LEVRSRDVPF LLEDGQIVGR LVYERMLERP ATLYGAGAGS NYQAQGLKLS 
KHFASEPEPP AA