Gene M446_2169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_2169
Symbol
ID	6132297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	2418844
End bp	2419959
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	75%
IMG OID	641642397
Product	3-dehydroquinate synthase
Protein accession	YP_001769065
Protein GI	170740410
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.105456
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCC CCCGCACGGT CCGCGTGCCC CTCGACGGCG GGCGCGCCTA CGACATCCTG 
GTCGGCCGCG GCCTCCTGGC CGCGGTCGGG CGCCACTGCG CCGACCTGGG CGCCCGGGCC 
GTGGCGGTGG TGAGCGACGC CACCGTGGCC GGCCTCTACG GGGAGGCGGT GCTGGCCTCC 
CTGCGGGAGG CGGGCCTGCG CGCCGTGCTG ATCACGGTGC CGCCGGGCGA GGGCTCGAAG 
AGCTTTCCCT GCTTCACGCA GGTGTGCGAC GCGCTCCTCA CCCACCGGAT CGAGCGGGGC 
GACCTCGTCC TGGCGCTCGG CGGCGGGGTG GTGGGCGACC TCGCGGGCTT CGCGGCGGCG 
GTCCTGCGGC GGGGCGTGCG CTTCGTGCAG GCACCGACGA CGCTGCTCGC CCAGGTCGAT 
TCCTCGGTCG GCGGCAAGAC CGGGATCAAC TCGCCCCACG GCAAGAACCT GATCGGCGCC 
TTCCACCAGC CGAGCCTGGT CCTCGCCGAC ACCGCCGCCC TCGACACGCT CTCGCCCCGC 
GAGATGCGGG CGGGCTACGC CGAGGTTGCC AAGTACGGGC TGATCGACGA CCCGGGCTTT 
TTCGGCTGGT GCGAGGCGCA TTTCGCCGAG ATCTTCGCCG GCGGGCCGGC CCGGGACGAG 
GCGGTGGCCT CCTGCTGCCG GGCCAAGGCC GGCGTCGTGG TGCGCGACGA GCGCGAGGAC 
GGGGAGCGGG CGCTCCTGAA TCTCGGCCAC ACCTTCGGGC ACGCCCTCGA GCGCCTGACC 
CGCTACGACT CGGCCCGGCT CGTCCACGGC GAGGCGGTGG CGATCGGCCT CGCGCTGGCC 
TTCCGGTTCT CGGCCCGGCT CGGCCTCTGC CCGGGCCAGG ATGCGGGGCG GGTGGCCAAC 
CACCTCGCCC TCGCGGGCCT GCCGACCACC CTGCGGCAGG TGCCGGGCGG CTGCGGCACG 
GCCGAGGAGC TGCTCGACGC CATGCGTCAG GACAAGAAGG TGCGCGACGG CGCCCTGACC 
TTCATCCTGG CCCGGGGGAT CGGCCAGAGC TTCATCGCGC CCGGCATCGA CCCGGAGCGT 
GTGCGGGACT TCCTGGCGGA GGAGATGAGG GGCTGA

Protein sequence

MSAPRTVRVP LDGGRAYDIL VGRGLLAAVG RHCADLGARA VAVVSDATVA GLYGEAVLAS 
LREAGLRAVL ITVPPGEGSK SFPCFTQVCD ALLTHRIERG DLVLALGGGV VGDLAGFAAA 
VLRRGVRFVQ APTTLLAQVD SSVGGKTGIN SPHGKNLIGA FHQPSLVLAD TAALDTLSPR 
EMRAGYAEVA KYGLIDDPGF FGWCEAHFAE IFAGGPARDE AVASCCRAKA GVVVRDERED 
GERALLNLGH TFGHALERLT RYDSARLVHG EAVAIGLALA FRFSARLGLC PGQDAGRVAN 
HLALAGLPTT LRQVPGGCGT AEELLDAMRQ DKKVRDGALT FILARGIGQS FIAPGIDPER 
VRDFLAEEMR G