Gene BAS1158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1158
Symbol	trpD
ID	2851732
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1205119
End bp	1206144
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	38%
IMG OID	637504415
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_027429
Protein GI	49184177
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAACT ATCTTCGTAA ATTAGTGGAG GGACAACATT TAACAGAAGA GGAAATGTAT 
AAAGCGGGGC TTCTTTTATT AAATGAAAAC ATATTGGAAA GTGAAATTGC AGCTTTCTTA 
GTTTTACTGA AAGCGAAAGG TGAAACTGCA GAAGAAATAT ACGGTCTCGT TCGAGCTCTT 
CGCGAAAAGG CATTACCGTT TTCGAATCAT ATACAAGGCG CGATGGACAA TTGCGGGACA 
GGTGGTGACG GTGCCCAAAC GTTTAATATT AGCACAACAT CCGCATTTGT ACTGGCAGGA 
GCTGGCGTAA AGGTTGCAAA ACATGGTAAT CGTGCTGTTT CTAGTAAAAC AGGAAGTGCA 
GATTTATTAG AAGAACTCGG TGTAAACATT AGTAGTACGC CAAACGAAAT TGATTATTTA 
TTAGAGCATG TCGGAATCGC ATTTTTATTC GCACCAGCGA TGCATCCAGC ATTAAAGCGC 
ATTATGAAAA TAAGAAAAGA ATTAAACGTT CCGACGATCT TTAACTTAAT TGGACCGTTA 
ACAAATCCGG TGAATTTAGA AACACAATTT GTCGGCATTT ATAAACGAGA TATGTTACTA 
CCAGTTGCGC AAGTACTACA GAAACTAGGA AGAAAACAAG CACTTGTCGT AAACGGAAGT 
GGGTTTTTAG ATGAAGCATC ATTGCAAGGA GAAAATCATG TTGTCATTTT AAAAGATAAT 
GAAATAGTAG AAACGAGTAT TGAACCTGAG AAATATGGAT TCTCAATAGT GAAAAACGAA 
GAGATTAGAG GCGGGAATTC GAAAGAAAAT GCAAAGATTA CGCTCGGAGT ATTAAGCGGA 
GAAAAAAGTG TTTACCGTGA TACTGTTTTA TTCAATGCAG GACTTGCCCT TTTCGCAAAT 
GGAAAAGCAA AGACGATTGA AGAAGGAATA ACACTCGCAG CACATAGCAT TGACTCTGGA 
AAAGCATTAG CGAAACTAAA CTTATTAATT GCAGCAAGTA ACGAAGAATT AGAAAGGGTG 
AATTAA

Protein sequence

MNNYLRKLVE GQHLTEEEMY KAGLLLLNEN ILESEIAAFL VLLKAKGETA EEIYGLVRAL 
REKALPFSNH IQGAMDNCGT GGDGAQTFNI STTSAFVLAG AGVKVAKHGN RAVSSKTGSA 
DLLEELGVNI SSTPNEIDYL LEHVGIAFLF APAMHPALKR IMKIRKELNV PTIFNLIGPL 
TNPVNLETQF VGIYKRDMLL PVAQVLQKLG RKQALVVNGS GFLDEASLQG ENHVVILKDN 
EIVETSIEPE KYGFSIVKNE EIRGGNSKEN AKITLGVLSG EKSVYRDTVL FNAGLALFAN 
GKAKTIEEGI TLAAHSIDSG KALAKLNLLI AASNEELERV N