Gene Athe_0843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0843
Symbol
ID	7407418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	934389
End bp	935690
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	36%
IMG OID	643715221
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_002572731
Protein GI	222528849
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0143924
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATGTTA AGATTGATGG AAGAAGAAAA ATAAACTCAA ATGTAATTGT TCCGCCTGAC 
AAGTCAATAT CCCACAGAAG TATCATGATT GGAAGTTTGG CAAATGGTGT GACAGAAATA 
GAAAACTTTC TTTTTTCAGA CGATTGCTTG GCGACCATCA ATTGTTTCAA AAATCTTAGC 
ACTGACATAG AAATTCGAAA TGACAAAATA ATTGTTAAAG GAAATGGCTT TGCTCTTAGT 
GCTCCAAAAC AGATACTGGA CTGTCAAAAT TCAGGAACAA CCACAAGACT TCTCCTTGGT 
ATTTTGTCAA CCCAGGAATT TGAATCTATT TTGACAGGTG ACAGCTCCCT TAAAAAAAGA 
CCTATGAAAA GGGTCACAGT ACCTCTTTCT CAAATGGGAG CTGAGTTTGA GTTTTTAGAA 
AAAGAAGATT TCTTGCCTAT TAAGGTAAAA GGCAGCAAAA AATTAAAACC GATTGAATAT 
ACCTTACCTA TTCCAAGTGC GCAGGTAAAA TCTGCATTGA TTTTTGCGTC TTTAAAAGCT 
GAAGGCAAAA GTGTCATAAA AGAAAGTCCT AAGTCAAGAG ATCACACAGA GCTTATGTTA 
AAGCATGCAG GAGCAAATAT AAAAAGCTGG GAAAAAGATG GGGTATATAC AGTAGAGATA 
CTGCCGAGTC AAATTTCCAG TATAAAGATA AAAATTCCAT CAGATATATC ATCTGCAGCA 
TTTTTTATTG TTCTTGCACT GATATGTGAA GGTAGCTCAG TGGTAATTGA AAACTGCATT 
TTAAACCCAA CAAGAACAGG TATAATTGAT GTTCTAAAAC AAATGGGTGC TGAGATTAAA 
ATTGAAGATG TGGAAAATAG AAATGGAGAG CTTGTGGGAA AAATAGTTGC AAGAAGCAGC 
AACCTAAGAG GTGTAAAGGT TGAAAAAAAC GATATTCCGC GCATCATAGA CGAAATACCT 
ATTTTGGCAG TTGCAGCGGC ATTTGCCGAA GGTAAAACCA TAATTGACCA TGCTTCAGAG 
CTAAGAGTAA AAGAGAGTGA TAGAATAAAG ACAACAGTTG AGATGCTGAA AAGTTTTGGA 
GCTGAGTGCT ATGAACTTGA AAACGGACTC GAAATAATAG GTTCAAGAGA AAAACTCAAA 
AGTGCAGTTG TAAATTCATA TAAAGATCAC AGAATAGCAA TGGCAGCATC TATCATGGCA 
TGTGCAGTGG AGGGTGAAAG TACCATTTTG GATGCAGACT GCGTATCAAT CTCTTTTCCA 
AACTTTTACG ACATTCTTTT TTCCTCAACA AAAAAGATAT AA

Protein sequence

MNVKIDGRRK INSNVIVPPD KSISHRSIMI GSLANGVTEI ENFLFSDDCL ATINCFKNLS 
TDIEIRNDKI IVKGNGFALS APKQILDCQN SGTTTRLLLG ILSTQEFESI LTGDSSLKKR 
PMKRVTVPLS QMGAEFEFLE KEDFLPIKVK GSKKLKPIEY TLPIPSAQVK SALIFASLKA 
EGKSVIKESP KSRDHTELML KHAGANIKSW EKDGVYTVEI LPSQISSIKI KIPSDISSAA 
FFIVLALICE GSSVVIENCI LNPTRTGIID VLKQMGAEIK IEDVENRNGE LVGKIVARSS 
NLRGVKVEKN DIPRIIDEIP ILAVAAAFAE GKTIIDHASE LRVKESDRIK TTVEMLKSFG 
AECYELENGL EIIGSREKLK SAVVNSYKDH RIAMAASIMA CAVEGESTIL DADCVSISFP 
NFYDILFSST KKI