Gene M446_3603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3603
Symbol
ID	6132913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	4018008
End bp	4019306
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	75%
IMG OID	641643770
Product	amidohydrolase 3
Protein accession	YP_001770418
Protein GI	170741763
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.893721
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0414709
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTTCG ATCACCTGTT CACCAACGCC CGCCTGCCCG GGCGCGACGG CCTCGTGGAC 
CTCGCGGTGC GGGACGGGCG CTTCGCGGCC GTCGAGCCCG GGCTGCCGCC GAACGGGCCG 
AGCGAGGATC TCGGCGGGCG GCTGGTGATC CCGGGCTTCG TCGAGACGCA TCTCCACCTC 
GACAAGGCCT GCCTCCTCGG GCGCTGCGAT TGCGGCGCCG GCAGCGTCGG GGAGGCGATC 
GCGGCCGTCA CGGCGGCCAA GCGCGGCTTC ACCGAGGCGG ACGTCTACGA GCGGGCGCGC 
CGGGTGCTGG AGCGCGCCGT CGCGCAGGGC ACCACCCGCA TCCGCACCCA CGTGGAGGTG 
GATCCCCGCA TCGGGCTGAC GAGCTTCCGG GCGCTGAGGC GCCTCAAGGC CGACTACGCC 
TGGGCGGTCG ATCTCGAACT CTGCGCCTTC CCGCAGGAGG GACTGCTCGA CGATCCGGGC 
TGCGAGGACG TGCTGGTCGC GGCCCTTGAG GAGGGGGCGG ACCTCGTCGG CGGCGTCCCC 
TACATCGACC GGGACGCGGA CGGCCACGTC GCGCGGATCT TCGCGCTCGC CCGGCGCTTC 
GACGTCGACA TCGACTTCCA CCTCGACTTC GACCTCGACC CGACCTGGCT GCGCCTCGAC 
GAGGTCTGCC GCTGGGCCGA CCGGACCGGC TGGGGCGGGC GCGTCGCCAT CGGCCACGCG 
ACCAAGCTCT CGGCCCTGCC ACCGGAGGCC TTCGGACGGG CGGCGCGGCG CCTCGCCGGG 
GCGGGCGTCG CCGTCACGGT CCTGCCCGCG ACCGACCTGT TCCTGATGGG GCGCGAGGCC 
GCCTGCAACG TGCCGCGCGG CGTGGCGGCG GCGCACCGGC TGGCGCGGGC CGGCGTCACC 
TGCTCGATCG CCACCAACAA CGTCCTCAAC CCGTTCACGC CCTACGGCGA CGCCTCGCTG 
CTGCGGATGG CGAACCTCTA CGCCAACGTC GCCCAGGTCT CGTCCGAGCC GGACCTCGCC 
CTCTGCCTCG ACCTCGTCAC CGACCAGGCG GCGCGGCTGA TGCGGTGTGC CGATTACGGC 
CTCGCCCCGG GCCGCCGGGC CGACCTCGTC GTGCTCGACG CGCGCAGCCC CGCCGAGGCG 
GTCTGCACCC TGGCCTGGCC GCTCCAGGGC ATGAAGAACG GGCGCCGGAG CTTCGCGCGG 
CCGATGCCGC TCCTGTCGCC GCCCGGCGAG GCCGCCCGCG CCCCGGGCCC GCTCCTGGGT 
CCGCCCCTGG GTCCTGCCCT GGGTCCTGCC CTGGGCTGA

Protein sequence

MDFDHLFTNA RLPGRDGLVD LAVRDGRFAA VEPGLPPNGP SEDLGGRLVI PGFVETHLHL 
DKACLLGRCD CGAGSVGEAI AAVTAAKRGF TEADVYERAR RVLERAVAQG TTRIRTHVEV 
DPRIGLTSFR ALRRLKADYA WAVDLELCAF PQEGLLDDPG CEDVLVAALE EGADLVGGVP 
YIDRDADGHV ARIFALARRF DVDIDFHLDF DLDPTWLRLD EVCRWADRTG WGGRVAIGHA 
TKLSALPPEA FGRAARRLAG AGVAVTVLPA TDLFLMGREA ACNVPRGVAA AHRLARAGVT 
CSIATNNVLN PFTPYGDASL LRMANLYANV AQVSSEPDLA LCLDLVTDQA ARLMRCADYG 
LAPGRRADLV VLDARSPAEA VCTLAWPLQG MKNGRRSFAR PMPLLSPPGE AARAPGPLLG 
PPLGPALGPA LG