Gene GBAA_3624 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GBAA_3624
Symbol
ID	2816584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. 'Ames Ancestor'
Kingdom	Bacteria
Replicon accession	NC_007530
Strand	-
Start bp	3328749
End bp	3329765
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	37%
IMG OID	637790363
Product	thiamine/molybdopterin biosynthesis MoeB-like protein
Protein accession	YP_020257
Protein GI	47528908
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0476] Dinucleotide-utilizing enzymes involved in molybdopterin and thiamine biosynthesis family 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.335
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGAGC GGTATTCACG ACAACAGTTG TTCAAACCGA TTGGGGATAG AGGACAAGAA 
AAGATTCGAA ATAAACATGT GTTAATTGTA GGGGCAGGCG CATTAGGAAG TGCAAGTGCT 
GAAAGTTTCG TACGTGCAGG CATTGGGAAG TTGACGATTA TTGATCGTGA TTATGTTGAA 
TGGAGTAATT TACAAAGACA ACAACTGTAC TCTGAAGAAG ATGCGAGAGA GAAATTGCCA 
AAAGCAATCG CTGCTAAAAA TCGGCTAGAA AAACTTAATT CGGAAGTACA AATAGATGCT 
TTCGTAATGG ATGCATGTGC AGAAAACTTG GAAGGACTAT TAGAAAATGT TGATGTAATA 
ATTGATGCAA CAGATAATTT CGATATCCGA TTTATAATAA ATGATTTATC ACAAAAATAT 
AATATCCCGT GGGTATATGG TTCTTGCGTT GGCTCGTACG GTATGAGTTA TACAATTATT 
CCGCAAGAGA CACCGTGTTT ACATTGTGTG CTGAAGAACG TTCCAGTTAC AGGTGTGACG 
TGTGATACAG CTGGAATTAT TAGTCCGACT GTTCAAATCG TTGCAGCATA TCAAGTGGCG 
GAAGCACTAA AAATTTTAGT AGAAGATTTT GCAGCAATTA GAAAAACATT TTTTATGTTT 
GATATATGGA GTAATCAAAA CCATTTTATA AAACTAGGAA AAATCAAGAC AGACGATTGC 
CCTTCGTGCG GTTTGAATCG AACTTATCCT TATTTATCAT ACGAAAATCA AACGAAGGTA 
GCCGTTTTGT GCGGAAGAAA TACAGTTCAA ATTAGAACGG TAGAAAGTAG ACAGTACAAT 
TTTGATGATA TAGAAAAAGT ATTAAAAAAA CTGGGGGAAG TAGATCGGAA TCCGTATTTA 
CTATCTTGCC AACTAGATGA GTACCGCGTC GTTATTTTTC GAGATGGTCG TGTTTTCATT 
CATGGTACAA ATGATATTTC AAAAGCGAAA CAGTTATATT ATCGCGTATT CGGTTAA

Protein sequence

MAERYSRQQL FKPIGDRGQE KIRNKHVLIV GAGALGSASA ESFVRAGIGK LTIIDRDYVE 
WSNLQRQQLY SEEDAREKLP KAIAAKNRLE KLNSEVQIDA FVMDACAENL EGLLENVDVI 
IDATDNFDIR FIINDLSQKY NIPWVYGSCV GSYGMSYTII PQETPCLHCV LKNVPVTGVT 
CDTAGIISPT VQIVAAYQVA EALKILVEDF AAIRKTFFMF DIWSNQNHFI KLGKIKTDDC 
PSCGLNRTYP YLSYENQTKV AVLCGRNTVQ IRTVESRQYN FDDIEKVLKK LGEVDRNPYL 
LSCQLDEYRV VIFRDGRVFI HGTNDISKAK QLYYRVFG