Gene Apar_0665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0665
Symbol
ID	8413525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	740747
End bp	741826
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	43%
IMG OID	645022242
Product	3-dehydroquinate synthase
Protein accession	YP_003179685
Protein GI	257784468
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACTA TTTCTGTTGA CCTTACATCT GACTCATATC AAATCTATGT AGGAGATTGC 
CTACTTTCAC AAACCGGCAA GCTCATTCAT TCATGCACAT CAGGTTCAAA AATTATCGTT 
ATCACTCATT CAGATTTGCA AGACCTCTAC GGCGCAAAGC TTCTCGCCTC TTTAGAGACA 
GCCGGTTACT CTGTCACAAC TGCAACAGTA CCCGCAGGTG AACACGCAAA ATCATTTGAG 
TTATATCAAA AACTGATTAA TACCCTTGCA GAAAATCATT TTACGCGAGA AGACATTGTT 
ATAGCTCTTG GCGGAGGTGT TATTGGCGAC CTCGCAGGAT TTGTTGCAGC TACCTACATG 
CGCGGCTGCT CGCTCATCCA CATTCCCACC TCACTTTTGG CGATGATCGA CTCCTCGATT 
GGTGGAAAAA CCGCCATTAA CCTACCATTT GGCAAAAACC TAGTTGGAGC CTTCTATAAC 
CCGAGGGCGG TCATTGTTGA CCTTGAGCTA CTGAACTCCA TTCCAGTATC TCTTTTGCAG 
GATAGCTGCG GCGAACTTAT TAAATACGGT GTTCTTTCTG GACGGGAGCT CTTCAATAAA 
ATCGCTTTGG CGAGAAACCC AATGCAGGTC ATCGATGAAG CCTACAGAAA AGAACTCATT 
CAAGCGTGCA TAGAAATAAA GAAATCAACT ATTGAAACAG ACTTTAAAGA AACAGGATTA 
AGAAAATTAC TTAACCTTGG CCACACACTT GGTCATGCTG TTGAAACGCT CAGCAACTTT 
GAGCTTGGAC ATGGCTCTTG TGTTGCCGCA GGAACCGTTA TGATGGCAAA GGCCTGCGCC 
AAACTTAATC TTTGTTCTTA TGAAGATGCT GAGAGTATCG CTAAGCTTAC GCAGTCTTAT 
GCGCTTCCTA CCAGCACCTT ATTTGATGTA GAAGAGCTTT ATAACGCAGC ACTTTATGAT 
AAGAAAAGCC ACGCGGATTC AATTGATGTA GCGCTTATCT ACGGTATTGG TGATGTACGC 
ATTAAACGCA AGTCATTTGC AGAACTTAAA CAACTTATTG AGCTTGCAAA GGAAGACTAA

Protein sequence

MNTISVDLTS DSYQIYVGDC LLSQTGKLIH SCTSGSKIIV ITHSDLQDLY GAKLLASLET 
AGYSVTTATV PAGEHAKSFE LYQKLINTLA ENHFTREDIV IALGGGVIGD LAGFVAATYM 
RGCSLIHIPT SLLAMIDSSI GGKTAINLPF GKNLVGAFYN PRAVIVDLEL LNSIPVSLLQ 
DSCGELIKYG VLSGRELFNK IALARNPMQV IDEAYRKELI QACIEIKKST IETDFKETGL 
RKLLNLGHTL GHAVETLSNF ELGHGSCVAA GTVMMAKACA KLNLCSYEDA ESIAKLTQSY 
ALPTSTLFDV EELYNAALYD KKSHADSIDV ALIYGIGDVR IKRKSFAELK QLIELAKED