Gene GWCH70_2142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_2142
Symbol	trpD
ID	7976952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	2208306
End bp	2209325
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	47%
IMG OID	644798958
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_002950118
Protein GI	239827494
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTAAGC AACTTCTTGC CAAATGTATT GAGGGGTATA CGTTGACAGA AGAAGAAGCG 
TATGAGGCGA TGATGATGAT AATGTCTGGA GAAGCCTCTG CCAGCCAGAT TGCCAGTTTC 
TTATCCATTT TGCGATTGCG CGGGGAAACG GTCGATGAAT TGACAGGATT GGTGAAAGCG 
ATGCGCAACC GAATGATGAC GCTCGATTAT GAAGAAGAAG CCATTGATAC GTGCGGAACA 
GGGGGAGACG GGGCATCGAC ATTCAACATT TCCACTGCGG CGGCGATCGT CGTATCATCA 
CTTGGTGTCA AAGTGGCCAA ACATGGCAAC CGAGCGGTTT CCTCAAAAAG CGGAAGCGCG 
GACGTATTAG AAGCGCTTCA TATTGATATT CAAGCAACCC CGGAGGAAGC GAAACGAGCG 
CTAAAAACGA AAGGATTGGC TTTTTTGTTC GCGCCGCTAT ATCATTCCGC CATGAAATAT 
GCTGCATTGC CGCGTAAAGA AATCGGGTTT CGCACTGTAT TCAATTTAAT TGGACCACTT 
TCGAATCCAG CACGGTGCAA GCGGCAAGTA ATCGGTGTTT ATTCGACACA ATACGCGGAA 
AAACTTGCGG AAACTCTTCA CCGACTTGGT TCGGAACACG TTTTATTGGT AACCGGAAAA 
GACGGACTTG ATGAATGCAG CATTTCGGCG GAAACAGATG TAGTCGAACT GAAACATGGT 
GAAATTCGCC GTTTCACGAT CGCGCCGGAA CAATATGGGC TCGCGCGTGG AAAGTTAGAA 
CACGTTCAAG TTCGTACGGT TCAACAAAGT GCTGAACTAT TAAAGGCAGT ATTGGAAGGA 
AGAGCAAACG AAAGCGCGAT CAATATCGTC ATTCTTAATG CTGGCGTTGC GTTATATGCA 
GCGGGGAAAG CAGCGACGAT TCGCGAAGGG GTCGAAATGG CAAAAGAAGC GATGATGACA 
AAGAAAGCCT ATGAACAATT TGAGCGACTG CGCATGAAAG AGGTAGAAAA GTATGCTTGA

Protein sequence

MFKQLLAKCI EGYTLTEEEA YEAMMMIMSG EASASQIASF LSILRLRGET VDELTGLVKA 
MRNRMMTLDY EEEAIDTCGT GGDGASTFNI STAAAIVVSS LGVKVAKHGN RAVSSKSGSA 
DVLEALHIDI QATPEEAKRA LKTKGLAFLF APLYHSAMKY AALPRKEIGF RTVFNLIGPL 
SNPARCKRQV IGVYSTQYAE KLAETLHRLG SEHVLLVTGK DGLDECSISA ETDVVELKHG 
EIRRFTIAPE QYGLARGKLE HVQVRTVQQS AELLKAVLEG RANESAINIV ILNAGVALYA 
AGKAATIREG VEMAKEAMMT KKAYEQFERL RMKEVEKYA