Gene Mnod_1111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_1111
Symbol
ID	7304423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	+
Start bp	1178751
End bp	1180127
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	72%
IMG OID	643598859
Product	hydroxydechloroatrazine ethylaminohydrolase
Protein accession	YP_002496421
Protein GI	220921120
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCAGG ACGAGGCGGT GGCGGGAGCG GCGGGCCCGC GGCTGTGGTT GCGCGATCCG 
CTCGCCATCC TGGCCGAGGA GGCGGGCGGC GGCCTCGTGG TGGAGGGGAC CCGCATCGTC 
GAGCGCGTGC CCGGCGGCGG CGCCCCCGCC TCCCCGGTGC ACGAGATCTT CGATGCCTCG 
CGCCACGTCA TCCTCCCGGG CCTCGTCAAC ACCCATCACC ACGTCTTCCA GACCCTCACC 
CGGGCCCATC CGGCGGCGAT CGACAAGCCG CTCTTCCCCT GGCTGAAGGC GCTCTATCCG 
TACTGGGCCC GGCTGACTCC GGAGGCGTTC CGGCTGGCGA CGCGGCTCGC CTACACGGAA 
CTGCTCCTCT CCGGCTGCAC CACCGCGGCC GATCATCACT ACCTGTTCCC GAGGGGCCTG 
GAGGAGGCGG TCGACATCCA GGTCGCGGAG GCGCGCGCGC TCGGCATCCG GGCCTGCGTC 
ACCCGCGGCT CGATGAGCCT GTCCGAGACC GAGGGCGGCC TGCCCCCCGA CAGCGTGACG 
CAGGATCACG ACGCGATCCT CGCCGATTGC GAGCGGGTGC TGAACCTCTT CCACGACCGC 
AGGCCCGGCG CGATGGTGCA GGTGGCGCTC AGCCCCTGCT CGCCCTTCGT GGTGACGAAG 
CGCCTGATGC GCGAGAGCGC GGCGCTCGCC GAGGCGCATG ATTGCCGCCT GCATACGCAT 
CTCGCCGAGA CCCGCGACGA GACCGACTAC TGCCTCGCGG CCTTCGGGCA GCGCCCGCTC 
GACTATCTGG AGGAGGTCGG CTGGCTGTCG CCCAGGACGT GGCTGGCCCA CGGCATCCAT 
TTCGACGATG CCGAGGTGGC ACGGCTCGGC CGCGCCGGCG TCGGCGTGTG CCATTGCCCG 
ACCTCCAACA TGACGCTCGC CTCGGGCTTC TGCCGCACCT GCGAGCTCGA AGCGGCCGGA 
AGCCCGGTCG GGCTCGGGGT CGACGGCTCG GCCTCAAACG ACGCCTCGAA CCTGATCGAG 
GAGGTGCGCC ACGCCCTGAT GCTCAACCGG CTCACCTACG GGGCCGAGGC GGTGACGCAT 
CGCGACGCCC TGCGCTGGGC CACCGAAGGC TCCGCCCGCT GCCTCGGGCG CGACGATATC 
GGCCGCATCG CGGAGGGGCT GGAGGCCGAC CTCGCCCTGT TCACCCTCGA CGACCTGCGC 
TTCTCCGGCA GCCACGATCC CCTGGCCGCG CTCGTCCTGT GCGGCGCGAG CCGGGCCGAC 
CGGGTCATGG TGGCGGGCGC TTGGCGCGTC GTCGACGGGC AGCCGCTCGG GATCGACCTG 
CGCGCGCTGC GGGAGGCGCA TGGGCGCATC GCCCGGGATC TCTTCGGGAT GGCTTGA

Protein sequence

MQQDEAVAGA AGPRLWLRDP LAILAEEAGG GLVVEGTRIV ERVPGGGAPA SPVHEIFDAS 
RHVILPGLVN THHHVFQTLT RAHPAAIDKP LFPWLKALYP YWARLTPEAF RLATRLAYTE 
LLLSGCTTAA DHHYLFPRGL EEAVDIQVAE ARALGIRACV TRGSMSLSET EGGLPPDSVT 
QDHDAILADC ERVLNLFHDR RPGAMVQVAL SPCSPFVVTK RLMRESAALA EAHDCRLHTH 
LAETRDETDY CLAAFGQRPL DYLEEVGWLS PRTWLAHGIH FDDAEVARLG RAGVGVCHCP 
TSNMTLASGF CRTCELEAAG SPVGLGVDGS ASNDASNLIE EVRHALMLNR LTYGAEAVTH 
RDALRWATEG SARCLGRDDI GRIAEGLEAD LALFTLDDLR FSGSHDPLAA LVLCGASRAD 
RVMVAGAWRV VDGQPLGIDL RALREAHGRI ARDLFGMA