Gene Mchl_2016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_2016
Symbol
ID	7118716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	+
Start bp	2111419
End bp	2112783
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	70%
IMG OID	643524766
Product	hydroxydechloroatrazine ethylaminohydrolase
Protein accession	YP_002420791
Protein GI	218529975
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGAAT CGAGCACCCG CCCCCGCCGT CTCTGGCTCC GCGATCCGTT GGCGATCCTC 
GCCGACGGGG CCGGCGGCGG GCTGGTGGTA GAGGGCACCC GCATCGCTGA AGTGGTGGCC 
GCGGGCGCCC GGCCCGCGAG CCCGGTCGAT GAGACGTTCG ACGCCTCGCG CCACGTCGTC 
ATCCCCGGTC TCGTCAACAC GCATCACCAC TTCTTCCAGA CGCTCACCCG CGCGCACCCG 
ATCGCGATCA ACAAGCCGCT GTTTCCCTGG CTGAAGGCGC TCTCGACCAT CTGGCCGCGG 
CTGACGCCGG ACGCCTTCCG GCTGGCGACG CGGCTCGCCT ACACAGAGCT TCTGCTGTCG 
GGCTGCACCA CGGCGGGCGA CCACCATTAC TTGTTCCCGA GAGGACTTGA GGCCGCCGTC 
GACATCCAGG TCGAGGAGGC GCGCTCCCTC GGTATTCGCG CCTTCGTGAC CCGCGGCTCG 
ATGAGCCTAT CGGAGAAGGA TGGCGGCCTG CCGCCCGAGA CGCTGGTGCA GGACGACGAG 
ACGATCCTGG CCGACAGCGA GCGGGTGCTC GGCCTGTTCC ATGATCCCGA GCCCGGCGCG 
ATGGTGCAGA TCGGGCTGGC TCCGTGCTCG CCGTTCAACG TCACCAAGCG GCTGATGCGC 
GAGAGCGCCG CGCTGGCGGA GCGCCACGAT TGCCGCCTGC ACACCCATCT CGGCGAGACG 
CTCGACGAGA ATGCCTATTG CCTGGAGGCG TTCGGGCAGC GCCCGGTCGA TTACCTCGAA 
GAGGTCGGCT GGATGGGACC GCGGGCCTGG CTCGCCCACG GCATCCACTT CAACGACGAC 
GAAGTGAGGC GCCTCGGCGC GGCCGGCGTC GGGGTGTGCC ATTGCCCGGC CTCGAACATG 
GTGCTGGCCT CGGGCCAGTG CCGCACCTGC GAGTTGGAGG CGGCGGGCTC CCCCGTCGGC 
CTTGGCGTCG ATGGCTCGGC CTCGAGCGAC AGCTCGAACC TGATGGAGGG CGTGCGCCAC 
GCCCTGATGA TCAACCGCCT GACCTACGGC GCGGAAGCCG TGACCCATCT CGACGCCCTG 
CGCTGGGCGA CGGAGGGCTC CGCCGCCTGC CTCGGGCGCA GCGACATCGG CCGGATTGAG 
CCCAGCCGCG AGGCGGATCT GGCCTTGTTC ACCCTCGACG AACTGCGCTT CTCCGGCGCC 
CACGACCCGC TCGCGGCTTT GGTGCTGTGC GGCGCTCACC GGGCGGACCG GGTGATGGTG 
GCGGGCACGT GGCGGGTGAT CGACGGGGAG CCCGTCGGCA TCGAGACTGG ACGCCTGCGC 
GAGGAGCACG GCCGGCTGGC CCGCACCCTG TTCGGAACGG CGTGA

Protein sequence

MMESSTRPRR LWLRDPLAIL ADGAGGGLVV EGTRIAEVVA AGARPASPVD ETFDASRHVV 
IPGLVNTHHH FFQTLTRAHP IAINKPLFPW LKALSTIWPR LTPDAFRLAT RLAYTELLLS 
GCTTAGDHHY LFPRGLEAAV DIQVEEARSL GIRAFVTRGS MSLSEKDGGL PPETLVQDDE 
TILADSERVL GLFHDPEPGA MVQIGLAPCS PFNVTKRLMR ESAALAERHD CRLHTHLGET 
LDENAYCLEA FGQRPVDYLE EVGWMGPRAW LAHGIHFNDD EVRRLGAAGV GVCHCPASNM 
VLASGQCRTC ELEAAGSPVG LGVDGSASSD SSNLMEGVRH ALMINRLTYG AEAVTHLDAL 
RWATEGSAAC LGRSDIGRIE PSREADLALF TLDELRFSGA HDPLAALVLC GAHRADRVMV 
AGTWRVIDGE PVGIETGRLR EEHGRLARTL FGTA