Gene Cphy_2540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2540
Symbol
ID	5741818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	+
Start bp	3110347
End bp	3111657
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	39%
IMG OID	641293630
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_001559640
Protein GI	160880672
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.341654
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTTC ATAAAGTGAA ACAGATAAAT GGTACCCTCA CCGTACCAGG TGATAAGTCC 
ATCTCACACC GTGCAGTTAT GTTTGGAGCT ATAGCAGAAG GAACTACAGA AGTTTATAAT 
TTCTTAAAAG GTGCTGACTG TCTCTCAACC ATACAGTGTT TTAGACAGCT GGGAATCAAT 
ATAGAAGAAG ATACTAAACA GCAAGTGATT CGAATTCACG GAAAAGGACT TCATGGATTA 
ACTCCACCTT CTACTATTCT TGATGTAGGT AATAGTGGAA CGACGCTCCG TCTTATTTCT 
GGAATATTAA GTGGTCAACC ATTTGAAAGT AACATTACCG GTGATAGTTC TATACAAAAA 
CGGCCAATGA ATAGAGTTAT TACACCTCTA AGCCTAATGA ATGCTGATAT TAAAAGTGTT 
CTAGGAAACG GTTGTGCACC ACTCTGCATT AATGGATCCT ATCAAAACGG CGCAAAGTCT 
GCCTTAAAGA GTATTCATTA TAATTCTCCT ATTGCCTCTG CACAAGTTAA ATCTTCTATT 
CTTTTAGCAG GTCTATATGC AGAAGGTGAA ACTTCAGTAA CTGAGCCATA CGTTTCGAGG 
AATCATACCG AACTTATGTT ACAAAAATTC GGTGCAAATC TTAGCGTAAA CGACAAAACA 
GTAACTATTC AACCTGAACC AAGGTTAATG GCACAAAAAG TTCATGTACC AGGAGACATC 
TCTTCTGCCG CTTATTTCCT TGCTGCTGCT TGTATACTCC CTAATTCTGA ACTTGTTATA 
AATAATGTAG GTGTAAATCC TACACGTGAT GGAATCATCG ATGTCTTGCT TGCGATGGGT 
GCTGACATTA CGAAAGAAGA TTTAAAGAAT CAAGAAGGTG AAGCAGTATG CAATCTAAGG 
GTTAGAAGCA GTAAACTTCA TGGCACTGTG ATTGAAGGAA GTATCATCCC TCGTCTTATT 
GATGAGATAC CTGTTATCGC TGTTGTTGCA TGTTTTGCAG AAGGCGATAC AATCATCAAA 
GATGCAGCCG AATTAAAGGT GAAAGAGTCC AATCGTATTG ATGTAATGGT ACAACAACTG 
AAACATATGG GCGCTAATCT TACTGCAACC GAAGATGGTA TGATTATTCA CGGAGGCCAA 
AAGCTATCTG GTACTGTCAT CGAAAGTAAA GAAGATCATC GTATTGCAAT GTCTTTCGCT 
ATTGCAAGCC TAATGGCCGA AGGCGAAACG ACTATTCAAG GTGCAGAATG TGTTAACATC 
TCCTATCCAG AATTTTATCA AGATTTGTAT AGACTAACCT GCGATAATTA G

Protein sequence

MKFHKVKQIN GTLTVPGDKS ISHRAVMFGA IAEGTTEVYN FLKGADCLST IQCFRQLGIN 
IEEDTKQQVI RIHGKGLHGL TPPSTILDVG NSGTTLRLIS GILSGQPFES NITGDSSIQK 
RPMNRVITPL SLMNADIKSV LGNGCAPLCI NGSYQNGAKS ALKSIHYNSP IASAQVKSSI 
LLAGLYAEGE TSVTEPYVSR NHTELMLQKF GANLSVNDKT VTIQPEPRLM AQKVHVPGDI 
SSAAYFLAAA CILPNSELVI NNVGVNPTRD GIIDVLLAMG ADITKEDLKN QEGEAVCNLR 
VRSSKLHGTV IEGSIIPRLI DEIPVIAVVA CFAEGDTIIK DAAELKVKES NRIDVMVQQL 
KHMGANLTAT EDGMIIHGGQ KLSGTVIESK EDHRIAMSFA IASLMAEGET TIQGAECVNI 
SYPEFYQDLY RLTCDN