Gene Acid345_3110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3110
Symbol
ID	4070224
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3695932
End bp	3696954
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	65%
IMG OID	637985129
Product	3-deoxy-D-arabinoheptulosonate-7-phosphate synthase
Protein accession	YP_592185
Protein GI	94970137
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.508417
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCTG CAGCCACAGA ATCGGAAATC AACCACGTGA TCGACCGGGT GAAAGAGCTC 
GGCTACCAGG CGCACGTAAC GCGTGGCACC GAGAAGACGA TCGTCGCCGC CGTTGGGAGT 
TCCGGCAACC GCGAACAACT GGCGGCGCTG GAGGCCGCGC CGGGCGTGGA GAACGTGGTC 
GTCATCGCGC ACCCATTCAA GCTCGTCAGT ATGCAGGTGA AACAGAAACG GACCGTGGTG 
AACGTGGGCG GCGTGCCGAT TGGCGGTGAG GCTTGCGTGC TTATGGCGGG GCCGTGCTCG 
GTGGAGTCGC GAGAGCAATT GATGACCGTG GCCCATGCGA TCGCGGCGGC CGGGGCAACG 
ATGCTGCGCG GCGGCGCATA TAAGCCGCGG ACCTCGCCGT ACGAGTTCCA GGGGCTGGGG 
ACGGAGGCGC TGAAGCTGCT GCGCGAAGCG TCCGAGGCAA CGGGTCTGCC GGTCGTCACA 
GAAGTGATGA GCACCGAGGA TGTGGACCTG GTGGCGGAGT ACGCGGACAT GCTGCAGGTG 
GGCGCGCGCA ATATGCAGAA TTTCTCGCTG CTGCGACGAT TGGCGAAATG CGAGCGGCCG 
ATTTTGCTGA AGCGGGCGCC GTCGGCAACA GTGAAGGATT GGCTGCTGGC GGCGGAGTAT 
CTGCTGGCGG GCGGCAATAG CCAGGTGGTG CTGTGCGAGC GCGGGATTCG CTCGTACGAT 
CCCGACATGC GAAACACGTT CGACCTGGCG GCGATTGCGC TGGCGAAACA GTTGTCGCAC 
TTGCCGGTTG TCGCCGATCC GTCGCATGGG ACCGGACGAC GCGATCTGGT GCCGATCATG 
GCGCGCGCGG CGGTGGCGGT TGGCGCGGAT GGCGTGATCG TCGAAGTGCA TCCGTGCCCG 
GAGAAGGCGC TGTCGGACGG ACCGCAATCG CTGACCCTGC CGGAGTTCGA GAAGATGGTG 
CAGTTGCTGG GGCAGCCGCT GCGTAGGCAT CTGCGGCAGG AATTGAAGGC GGCGACAGCG 
TAG

Protein sequence

MSSAATESEI NHVIDRVKEL GYQAHVTRGT EKTIVAAVGS SGNREQLAAL EAAPGVENVV 
VIAHPFKLVS MQVKQKRTVV NVGGVPIGGE ACVLMAGPCS VESREQLMTV AHAIAAAGAT 
MLRGGAYKPR TSPYEFQGLG TEALKLLREA SEATGLPVVT EVMSTEDVDL VAEYADMLQV 
GARNMQNFSL LRRLAKCERP ILLKRAPSAT VKDWLLAAEY LLAGGNSQVV LCERGIRSYD 
PDMRNTFDLA AIALAKQLSH LPVVADPSHG TGRRDLVPIM ARAAVAVGAD GVIVEVHPCP 
EKALSDGPQS LTLPEFEKMV QLLGQPLRRH LRQELKAATA