Gene Mchl_2177 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_2177
Symbol
ID	7116123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	2275052
End bp	2276626
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	69%
IMG OID	643524927
Product	dihydropteroate synthase DHPS
Protein accession	YP_002420952
Protein GI	218530136
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0294] Dihydropteroate synthase and related enzymes
TIGRFAM ID	[TIGR00284] dihydropteroate synthase-related protein

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.339932
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.330618
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGCGC CCGAACATCT CGTCTTCATC ACCGGCAAGC TGGCCCATGC CCGCCTCGAA 
AAGGTCGCGG CCACGCTGCC GGCCGAGCGC TTCACCTGGA GCATCGCCGA TGCCGGGGTG 
AAGGTCGCCG CGCTGATGAC GGAGGAAATC ATCAAGCGCC GGGTGCAGAT GCCCGAGGGC 
GCGACCCGGA TCGTCCTGCC CGGCCGCTGC CGCGCCAACC CGGAGGCGCT GGCCCAGCAT 
TTCGGCCTCC CGGTGGAGCG GGGGCCGGAC GAGATCGTTG ATTTGCCGGC TTATCTTGGT 
CTGACCGGGC GTAAGGTCGA TCTCTCGCGC CACGATCTGC GCATCTTCTC CGAGATCGTC 
GACGCCTCGA AGATGACGCC CGACCAGATC CTGGCCAAGG GTCTCGACCT CGCCCGCCGC 
GGGGCCGACG TGATCGACCT CGGCGGGCTG CCCGACACGG CGTTCCCGCA TCTGGAGGAC 
AGCGTCCGGG CGCTGAAAGG CGCTGGCCTC AAGGTCAGCG TCGATTCCTT CTCCCTCGAC 
GAGCTGACCC GTGGGGCGCG GGCCGGCGCC GACTTCCTGC TGAGCCTCAA CGAGGAGACG 
CTGGATCTCG CCTTCGAGAC CGACGCGGTG CCGATCCTCG TGCCGATGCG GCCCGACGAC 
CTGCCCTCCC TCGACCGCGC CATCGAACGG ATGGAGCGGG CGGGCCGGCC CTACATGGCC 
GATCCGATCC TGGAGCCGAT CCATTTCGGC TTCGTCGACT CGATCGTCCG CTACCGCGAG 
ATCCGCGCGC GCTGGCCGAA CATCGAGATG ATGATGGGCA CCGGCAACCT CACCGAACTG 
ACCGAGGCCG ACAGCCTCGG TGTCACGGCG CTCCTCGTCG GCATGTGCTC GGAACTCGCC 
ATCCGCAACG TGCTGATCGT GCAGGTCTCG AACCACACCC GCCGCACGGT GGAGGAGCAC 
GACGCCGCCC GCCGGGTGAT GTACGCGGCC AAAGAGGACG CCGCCCTGCC CAAGGGCTAC 
GGCCGCGAGT TGCTGGCGCT GCACGACAAG CGCCCCTTCG TGCAGACCTC CGATGAAATT 
GCCGCTCTGG CCGCCGAGGT GCGTGATCCC AATTACCGCA TCGCCGTCGC CGAGGACGGC 
ATCCACGTCT ACAACCGCGA CCGTCACACC ACCGGCACCG ACGCGATGGC CTTCTTCCCC 
GAACTGAGCG TGGAGAGCGA CGGCGCGCAC GCCTTCTATC TCGGCGGAGA ACTGACGAAG 
GCCGAGACCG CGTTCCGCCT CGGCAAGCGC TACGTGCAGG ACGAACCCCT CGATTGGGGC 
TGCGCCGCCG ACCGCACCCA GGAAGACACC ACCGCCTTCA AGGCGGCCGG GCCGACGAAA 
TCGGCGCATA CCAAGCATAG CGGCCCCGAG GCGCCCGCGG CCGAGCGCGC GACCCGGACC 
GATCCGGAGC GCGACGCCGC ACCGCCGCGG ACCGAGACCG GAAGCAGCAC GGCATCGGAA 
CGCGACCCGC TCAGCGAGCC GAAGGGCGGC CGCATCGTCT GCGGCCGGCT GGTGCCCGAC 
GAGGACCGGA ATTAG

Protein sequence

MSAPEHLVFI TGKLAHARLE KVAATLPAER FTWSIADAGV KVAALMTEEI IKRRVQMPEG 
ATRIVLPGRC RANPEALAQH FGLPVERGPD EIVDLPAYLG LTGRKVDLSR HDLRIFSEIV 
DASKMTPDQI LAKGLDLARR GADVIDLGGL PDTAFPHLED SVRALKGAGL KVSVDSFSLD 
ELTRGARAGA DFLLSLNEET LDLAFETDAV PILVPMRPDD LPSLDRAIER MERAGRPYMA 
DPILEPIHFG FVDSIVRYRE IRARWPNIEM MMGTGNLTEL TEADSLGVTA LLVGMCSELA 
IRNVLIVQVS NHTRRTVEEH DAARRVMYAA KEDAALPKGY GRELLALHDK RPFVQTSDEI 
AALAAEVRDP NYRIAVAEDG IHVYNRDRHT TGTDAMAFFP ELSVESDGAH AFYLGGELTK 
AETAFRLGKR YVQDEPLDWG CAADRTQEDT TAFKAAGPTK SAHTKHSGPE APAAERATRT 
DPERDAAPPR TETGSSTASE RDPLSEPKGG RIVCGRLVPD EDRN