Gene Cagg_0117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0117
Symbol
ID	7266855
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	162911
End bp	164218
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	58%
IMG OID	643564989
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_002461505
Protein GI	219847072
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.293801
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0224314
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGAGA TAACGTTAAC CGCACCCAAG CGTTTGCGCG GAGTTATTCA GGTACCGGGA 
GATAAATCGA TCTCACACCG ATCGGTGTTG CTGAACGCGA TTGCTACCGG CAGTGCTCAC 
ATTACGAACT TTTTACCCGG TGCCGATTGT CTTTCCTCGG TAGCCTGTGT GCGAAGCCTA 
GGCGTAACGG TCGAGCAGCC TCATGAGCGT GAATTGATTA TCCACGGTGT TGGTCTGGGT 
GGATTACGTG AATCAACCGA TGTGCTCGAC TGTGGTAATT CCGGTACTAC GCTGCGTCTG 
CTGGCCGGCA TACTGTCCGG TCAGCCGTTT TTTAGTGTCT TGAGCGGTGA TTCATCGTTG 
CGTTCGCGTC CGCAGCGGCG GGTTGTTGGG CCACTGCGTG CAATGGGTGC GCAGATCGAT 
GGGCGCGCCG ACGGCGACCG GGCACCGCTG GCAATTCGCG GTAGTACGCT ACGTGGTGGT 
CAGTACGAAT TGACTATCGC GTCCGCCCAG GTGAAATCTG CTCTCTTGTT GGCTGCACTG 
TATGCCGATG GCCCACTGAC GCTCGGTGGA CGGATCGATT CGCGCGATCA TACCGAGCGG 
ATGCTTGCGG CAATGGGGGT GGAGATAACC GTATCGCCTG ACCGGATTAC CCTGCATCCG 
CCGACAGCAG CAACTGCCCC GGTCGCTCTT TCCCTGCGGG TCCCCGGTGA TCCCTCCTCG 
GCAGCGTTTT GGTGGGTAGC TGCTGCGATC CATCCCGATG CCGAACTTGT CACTCCTGGC 
GTCTGTCTCA ACCCGACCCG TACCGGTGCC CTTGATGTGC TGCGGGCGAT GGGGGCTGAG 
ATTGAAATAA TGAACGAGCG GTTGGAAGGG AGTGAGTTGG TCGGCGATGT CGTCGTCCGC 
TCTTCGGTGT TGCGGGGGAC AACCATCGCC GGCTCTCTGA TCCCTCGTCT GATTGATGAA 
ATTCCGGTGC TAGCCGTCGC TGCTGCCTGT GCCGATGGTG AAACGGTTAT TCGTGATGCG 
CAAGAATTGC GCGCTAAAGA GACCGATCGG ATCACCACCG TGGCTGCCGG GCTGAGTGCG 
TTGGGGGTTA CCGTCGAACC AACGATTGAT GGTATGGTGA TCACCGGTAA ACCCGATCAA 
CTCACCGGTG CTACTTTGCA CAGCTATCAC GACCATCGCC TGGCAATGGC ATGGGCCGTT 
GCCGCCCTTG TCGCTCGTGG TGAAACAACC ATTGTTGAAC CGGCAGCAGT GGTGATCAGC 
TATCCCGATT TCTGGCAGAC TCTCGCCGCG ATCCAGGAGG ACGTATGA

Protein sequence

MTEITLTAPK RLRGVIQVPG DKSISHRSVL LNAIATGSAH ITNFLPGADC LSSVACVRSL 
GVTVEQPHER ELIIHGVGLG GLRESTDVLD CGNSGTTLRL LAGILSGQPF FSVLSGDSSL 
RSRPQRRVVG PLRAMGAQID GRADGDRAPL AIRGSTLRGG QYELTIASAQ VKSALLLAAL 
YADGPLTLGG RIDSRDHTER MLAAMGVEIT VSPDRITLHP PTAATAPVAL SLRVPGDPSS 
AAFWWVAAAI HPDAELVTPG VCLNPTRTGA LDVLRAMGAE IEIMNERLEG SELVGDVVVR 
SSVLRGTTIA GSLIPRLIDE IPVLAVAAAC ADGETVIRDA QELRAKETDR ITTVAAGLSA 
LGVTVEPTID GMVITGKPDQ LTGATLHSYH DHRLAMAWAV AALVARGETT IVEPAAVVIS 
YPDFWQTLAA IQEDV