Gene GWCH70_2135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_2135
Symbol
ID	7976946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	2201338
End bp	2202624
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	47%
IMG OID	644798951
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_002950111
Protein GI	239827487
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.014689
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCAACCGT TGCGAACCAA TATTTCATCA TTACGAGGAA CCATCAATGT TCCAGGGGAT 
AAATCGATTT CCCATCGCGC TGTGATGCTT GGAGCAATTG CTAATGGAAC AACGACCATC 
GCGAATTTTT TACAGGGAGA AGATTGTTTA AGTACGATCG ATTGTTTTCG AAAATTGGGA 
GTGTCGATTG AGCAAAACGG AAGCGATGTT GTTGTCGAAG GAAAGGGATT AAAAGGTCTT 
AAGGAGCCAT CTGACATTTT AAATGTTGGC AATTCCGGGA CAACGGCAAG ATTATTGCTC 
GGGATTCTAG CGGGATGTCC GTTCCATTCT TGCTTAATTG GCGATGAATC GATCGCCAAG 
CGGCCGATGG GTAGAGTGAC AAAGCCGCTA AAAATGATGG GTGCGCACAT TGACGGCCGC 
GAGCATGGGA ACTATACCCC GTTATCCATT CGCGGCGGCG AACTTCAGCC CATTCATTAC 
GAGTCTTCTG TCGCGAGCGC ACAAGTGAAG TCGGCGATTT TATTGGCGGG ATTGACAACA 
AATGGAACTA CGACAGTAAC GGAACCTCAT CGTTCTCGCG ATCATACCGA ACGAATGATT 
CGGTTGTTCG GTGGAAGCGT AACAGTGGAC GACCTTACAG TTTCTATTAC CGGACCGCAG 
CAGCTAATAG GCGCAAATAT ATACGTTCCG GGAGATATTT CGTCGGCAGC CTTTTTCTTA 
GTAGCTGGCG CAATTGTACC AAACAGCGAA ATTACGTTAA AAAATGTCGG GCTCAATCCG 
ACAAGAACGG GAATTATCGA TGTGCTGCAA AAAATGGGTG CGGAAATGAC GATCGAAAAC 
ATTCGTAACG AGCAAACAGA ACCGCTTGGC GATATTACCA TTCGCACCTC CAATTTAACA 
GCGACGGAAA TCAGCGGCGC TCTTATTCCG CGATTAATCG ACGAAATCCC GATCATTGCC 
TTGCTTGCAA CGCAGGCGGA AGGTACGACC GTTATTAAAG ATGCGAGCGA ATTGAAAGTG 
AAGGAAACGA ATCGAATTGA TACGGTTGTG ACAGAGCTGC GAAAACTTGG CGCGGATATT 
AAAGCGACAG CTGATGGCAT GGTCATTCAT GGAAAATCAG CGTTAAAGGC AAAGGACGTT 
GTCGTTGATA GCTACGGTGA TCACCGTATT GGCATGATGC TAGCGATTGC TGCCTGCATT 
ACGCAAGGAA CTGTCTGTTT AAAACGTCCA GAAGCGGTGG CAGTCTCTTA TCCATCGTTT 
TTTGATCATC TTCATTCCTT AATGTAG

Protein sequence

MQPLRTNISS LRGTINVPGD KSISHRAVML GAIANGTTTI ANFLQGEDCL STIDCFRKLG 
VSIEQNGSDV VVEGKGLKGL KEPSDILNVG NSGTTARLLL GILAGCPFHS CLIGDESIAK 
RPMGRVTKPL KMMGAHIDGR EHGNYTPLSI RGGELQPIHY ESSVASAQVK SAILLAGLTT 
NGTTTVTEPH RSRDHTERMI RLFGGSVTVD DLTVSITGPQ QLIGANIYVP GDISSAAFFL 
VAGAIVPNSE ITLKNVGLNP TRTGIIDVLQ KMGAEMTIEN IRNEQTEPLG DITIRTSNLT 
ATEISGALIP RLIDEIPIIA LLATQAEGTT VIKDASELKV KETNRIDTVV TELRKLGADI 
KATADGMVIH GKSALKAKDV VVDSYGDHRI GMMLAIAACI TQGTVCLKRP EAVAVSYPSF 
FDHLHSLM