Gene Moth_1555 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1555
Symbol
ID	3832188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1598427
End bp	1599521
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	65%
IMG OID	637829487
Product	3-dehydroquinate synthase
Protein accession	YP_430407
Protein GI	83590398
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.267288
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTGGAG AGCTTAACGT AGACCTGGGC GAGCGAACTT ATAAAATCCA CTGCGGCTCC 
GGATTGCTGC CGGTGGCAGG TTCCATCTTG CGTAATCTTA ATCTGGCAGC CCCCTGCCTG 
GTGGTAAGCA ATGCCACTGT GGCCGGGCTC TACTGGCCTG TGCTGGAATC CAGCCTGAAG 
GCCGGAGGCT TTAACCCCCA CCTGGCCCTG GTACCCGATG GAGAAGAGGC CAAAACCCTT 
CAGGTGGCAG CTAGCCTCTA CGACTCCGCC CTGGCCGCCG GGATCGAGCG CCAGGCCGCC 
GTCATCGCCC TGGGCGGCGG AGTGGTGGGC GATGTCTCCG GGTTTATAGC CGCCACCTGG 
CTGCGGGGGG TTCCTTTCAT CCAGGTGCCC ACCACCCTCC TGGCCCAGGT GGATTCCAGC 
GTCGGCGGCA AGGTGGCCGT CAACCACCCC GGCGGCAAAA ACCTCATCGG CGCCTTTTAC 
CAGCCGCTGG CCGTTATCGC CGATCTGGAT ACCCTGACCA CCCTGCCGCC GCGGGAGATC 
CGGGCCGGCC TGGCTGAGGT CATCAAGTAC GGGGTAATCG GCGACGCCAG CTTTTTTGCT 
TATTTAGAAG AGCACCTGGA GGGAGCCCTG GCCGGGGATA AGGAAGTCCT GGAAACCATC 
GTCCTGCGTA GCTGCGCCAT GAAGGCGGCG GTGGTGGCCA GGGACGAGCG GGAAAGCGGC 
CTGCGGGCCG TCCTGAACTT CGGGCATACA GTCGGTCATG CCGTTGAGGC CGTTACCGGT 
TTTACCGCCT ACCGCCACGG TGAGGCGGTG GCCATGGGTA TGGTGGCCGC CGCCCGCCTG 
GCCGTCCGGC GGGGTATGTT TTCTATGGAA GAGACCGGGC GGCTGGTGCG CCTTTTAGCA 
AGGGCCGGCC TGCCGGTGAC CCTGCCGGAC CTCGATCCGG CAACCTTCCG GGCGGCCCTG 
GGCCACGACA AAAAGATCCG CCAGGGCCAG CTGCGGATGG TCCTGCCGGA AAGCCTGGGC 
CGGGTGCGTC TTGTCCCCGT CAGTATCGAG GAAATCGCGG CGGTGGTTGA AAACGGTGCG 
GCAGCGGAGG GGTGA

Protein sequence

MAGELNVDLG ERTYKIHCGS GLLPVAGSIL RNLNLAAPCL VVSNATVAGL YWPVLESSLK 
AGGFNPHLAL VPDGEEAKTL QVAASLYDSA LAAGIERQAA VIALGGGVVG DVSGFIAATW 
LRGVPFIQVP TTLLAQVDSS VGGKVAVNHP GGKNLIGAFY QPLAVIADLD TLTTLPPREI 
RAGLAEVIKY GVIGDASFFA YLEEHLEGAL AGDKEVLETI VLRSCAMKAA VVARDERESG 
LRAVLNFGHT VGHAVEAVTG FTAYRHGEAV AMGMVAAARL AVRRGMFSME ETGRLVRLLA 
RAGLPVTLPD LDPATFRAAL GHDKKIRQGQ LRMVLPESLG RVRLVPVSIE EIAAVVENGA 
AAEG