Gene Mmar10_2274 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_2274
Symbol
ID	4286740
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	2478558
End bp	2479661
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	67%
IMG OID	638141776
Product	3-dehydroquinate synthase
Protein accession	YP_757504
Protein GI	114570824
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.492898
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGACA TTCTGCGGGT CACCGTCGGC TTGGGAGACC GGGCCTATGA CGTGCTGGTC 
GGCGCGGGCG CCCTTTCCGC AGCCGGTCCG GAACTGGTCG CCCATTTCCC GCGCGGCCGG 
GCCATCCTGG TGACCGACCG GCATGTCGCC GACCTGCATC TCGACGCCGT GACCGCACAG 
CTGAGCAGGC TGGGCCTGCG TGTCGAGCCG GTCATTATCG CCCCCGGCGA AACATCCAAG 
AGCTGGGCCG GGCTGGAACA GGTCGTCGAC GCGCTTCTCG ATCGCAATAT CGAGCGATCC 
GAAGCCGTGA TCGCGCTGGG TGGCGGTGTC ATTGGCGACC TGACCGGATT TGCGGCGGCG 
GTGACCAAGC GCGGGGTCAA CTTCATCCAG ATTCCCACCA CCCTGCTCGC CCAGGTCGAC 
AGCTCGGTTG GCGGCAAGAC CGGTATCAAT ACAACCCACG GCAAGAATTT CGCCGGTAGT 
TTCCACCAGC CAAAGCTGGT GATCGCCGAT CGCGATCTGC TGGCAACGCT CCCGGACCGC 
GAGCGCCGTG CCGGCTATGC GGAAATCGTC AAGGCCGCGC TGATCGGTGA TGCCCCGCTG 
TTCGCGCAGC TGGAAGCCGC TGGCGCTGGC GTGCTGGACG GTGCCGACCT GGATCAGGCT 
GTTGCAGCGG CGGTCGCCTT CAAGGCCCGG ATCGTCGCCG AGGACGAACG CGAAACAGGC 
GTCCGCGCCC TGCTCAATCT GGGCCATACT TTCGGCCATG CCTTTGAAGC CGATGCGCCC 
AAGGATGTGA TCCGGCATGG CGAGGCGGTC GCGGTCGGCA CGGCGCTGGC CTTTGCCTAT 
TCCGCCCATC GCGGCGATTG CAGCGCCGAC CACGCGGCAC GCGTCGCGGC CCATTTGCGC 
GCGGTCGGGC TGCCGGCCAG TCCCGCCGAA CTTGCGCACA GCGACTGGAA TGCCGCCAGC 
CTCGTTTCCC GGATGCGCGA CGACAAGAAG AACCGCGACG GCCGCATCAC CCTCATCCTC 
GCCCGCGCCA TCGGCGCAGC ATTCATTGAC CCGGCGGCCG ACGAAGCCGA CCTTCTCGCC 
TTTATGGAGA CCCAGCTCTC ATGA

Protein sequence

MSDILRVTVG LGDRAYDVLV GAGALSAAGP ELVAHFPRGR AILVTDRHVA DLHLDAVTAQ 
LSRLGLRVEP VIIAPGETSK SWAGLEQVVD ALLDRNIERS EAVIALGGGV IGDLTGFAAA 
VTKRGVNFIQ IPTTLLAQVD SSVGGKTGIN TTHGKNFAGS FHQPKLVIAD RDLLATLPDR 
ERRAGYAEIV KAALIGDAPL FAQLEAAGAG VLDGADLDQA VAAAVAFKAR IVAEDERETG 
VRALLNLGHT FGHAFEADAP KDVIRHGEAV AVGTALAFAY SAHRGDCSAD HAARVAAHLR 
AVGLPASPAE LAHSDWNAAS LVSRMRDDKK NRDGRITLIL ARAIGAAFID PAADEADLLA 
FMETQLS