Gene M446_5017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_5017
Symbol
ID	6132403
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	5499936
End bp	5501351
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	73%
IMG OID	641645153
Product	dihydropteroate synthase DHPS
Protein accession	YP_001771778
Protein GI	170743123
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0294] Dihydropteroate synthase and related enzymes
TIGRFAM ID	[TIGR00284] dihydropteroate synthase-related protein

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00770286
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCGAGC ACCTCGTCTT CGTCACCGGG CGCCTCGCCA AGCCGCGGCT CGAATCGGTC 
GTCGCGGCGC TCCCGCGCGA GCGCTTCACC GGCACCATCG CGGATGCGGG CGTGAAGGTC 
GCCGCGCTGA TGACCGAGGA GATCATCCGC CGCCGCGTCA CGCTGCCGGA GGGGGCCGAC 
CGCGTCATCC TGCCGGGGCG CTGCCGGGCC GACCTCGCCG CGCTCTCCGC CCATTTCGGG 
GTGCCGGTCG AGCGCGGGCC CGACGAGATC GTCGACCTGC CGGCCCATCT CGGCCTCGCC 
GGCCGCAAGG TCGACCTGTC GCGGCACGAC CTCACCATCT TCTCGGAGAT CGTCGACGCC 
TCCCGCATGA CGCCGGACGA GATCCTCGTC CGCGCCCGGG ACCTCGCCCG CCGGGGCGCC 
GACGTGATCG ACCTCGGCGG CCTGCCGGAC ACGCCCTTCC CGCACCTGGA GGAGGCGGTG 
CGGCTGCTGA AGGGGGCGGG CCTGCGGGTC AGCGTCGATT CCTTCGACCG CGAGGAACTC 
GCCCGGGGCG CGCGGGCGGG CGCCGATTTC CTGCTGAGCC TCAACGAGGA CAGCCTCGAC 
CTCGCCTTCG AGACCGACGC CGTGCCGGTG CTGGTGCCGG TGCGGCCCGA CGACCTCGAG 
TCCCTCGACC GCGCGATCGC GCGGATGCGG GCGGCGGGAA AGCCCTTCCT GGCCGACCCG 
ATCCTGGAGC CGATCCATTT CGGCTTCGCC GCCTCGATCG TGCGCTACCA CGAGACCCGC 
CGCCGCCATC CCGACATCGA GATGATGATG GGGACCGGCA ACCTGACCGA ACTGACCGAG 
GCGGACAGCG TCGGGGTGAC GGCGCTCCTG GTCGGCCTGT GCTCGGAACT GGCGATCCGC 
AACGTGCTGA TCGTGCAGGT CTCGAACCAC ACCCGACGCA CGGTCGAGGA GCACGACGCC 
GCCCGGCGGG TGATGTACGC GGCCCGCGCC GACGGGGCGC TGCCGAAGGG CTACGGCCGC 
CAGCTCCTCG GACTCCACGA CAAGCGCCCC TACACGCAGA CGCCCGAGGA GATCGCGGCG 
CTGGCCGCCG AGGTGCGCGA CCCGAACTAC CGCGTCGCGG TCGCGCAGGA CGGGGTCCAT 
GTCTACAACC GGGCGATCCA CAAGGTCGGC ACCGACGCCA TGGCGTTCTT CCCCGACCTC 
GACGTGGCGA CCGACGGCGG CCACGCCTTC TATCTCGGCG GGGAATTGAC CAAAGCCGAA 
CTCGCCTGGC GGCTCGGCAA GCGCTACGTG CAGGACGAGC CCCTGGACTG GGGCTGCGCG 
GCGGATGCGG CGGCGGAGGA CACCACCGCG TTCAAGGAGG TCGGCCACAC CCTGCACGGG 
CGCCGGCCGG CCCGCGCGCC CGACGGGACG GAGTGA

Protein sequence

MTEHLVFVTG RLAKPRLESV VAALPRERFT GTIADAGVKV AALMTEEIIR RRVTLPEGAD 
RVILPGRCRA DLAALSAHFG VPVERGPDEI VDLPAHLGLA GRKVDLSRHD LTIFSEIVDA 
SRMTPDEILV RARDLARRGA DVIDLGGLPD TPFPHLEEAV RLLKGAGLRV SVDSFDREEL 
ARGARAGADF LLSLNEDSLD LAFETDAVPV LVPVRPDDLE SLDRAIARMR AAGKPFLADP 
ILEPIHFGFA ASIVRYHETR RRHPDIEMMM GTGNLTELTE ADSVGVTALL VGLCSELAIR 
NVLIVQVSNH TRRTVEEHDA ARRVMYAARA DGALPKGYGR QLLGLHDKRP YTQTPEEIAA 
LAAEVRDPNY RVAVAQDGVH VYNRAIHKVG TDAMAFFPDL DVATDGGHAF YLGGELTKAE 
LAWRLGKRYV QDEPLDWGCA ADAAAEDTTA FKEVGHTLHG RRPARAPDGT E