Gene BAS4020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4020
Symbol
ID	2850961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	3956591
End bp	3957784
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	40%
IMG OID	637507257
Product	bifunctional 3,4-dihydroxy-2-butanone 4-phosphate synthase/GTP cyclohydrolase II protein
Protein accession	YP_030270
Protein GI	49187018
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II [TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTCATC GTATTGAAGA AGCTCTAGAA GATTTAAAAC AAGGAAAAGT CGTTATCGTA 
TGTGATGATG AAAACCGTGA AAACGAAGGC GATTTTATCG CTTTAGCAGA GTATATTACG 
CCCGAAACAA TTAACTTTAT GATTACACAT GGACGCGGTC TCGTTTGTGT ACCGATTACG 
GAAGGATACG CAGAACGTCT ACAATTAGAA CCAATGGTAT CTCATAATAC AGATTCGCAT 
CATACTGCAT TTACAGTGAG CATTGACCAT GTTTCTACAA CAACAGGCAT TAGCGCTCAC 
GAACGTGCAA CTACAATACA ACAATTGTTA AATCCTGCAT CAAAAGGTGC TGATTTCAAT 
CGACCTGGAC ATATCTTTCC ATTAATCGCG AAAGAAGGCG GTGTCCTGCG TCGTGCTGGT 
CATACAGAAG CTGCTGTCGA TTTAGCACAG CTTTGCGGAG CAGAACCAGC TGGAGTCATT 
TGCGAGATTA TCAATGAGGA CGGTACGATG GCACGCGTCC CTGATTTACT ACAGTGTGCA 
AAACAATTTG ATATAAAAAT GATTACAATA GAAGATTTAA TTGCTTATCG CCGCCATCAT 
GAAACACTTG TGACGAGAGA AGTGGAAATT ACATTACCTA CAGATTTCGG TACTTTTCAA 
GCAATTGGCT ATTCTAACTC ATTAGATACG AAAGAACATA TTGCACTCGT AAAAGGTGAT 
ATTTCAACAG GTGAGCCTGT ACTTGTACGC GTTCATTCAG AGTGCTTAAC AGGAGATGTA 
TTTGGCTCGT GCCGCTGTGA TTGCGGACCA CAACTCCATG CTGCACTTGC TCAAATTGAA 
CGTGAAGGAA AAGGCGTTCT TCTTTATATG AGACAAGAAG GACGAGGCAT TGGCCTTCTT 
AATAAGCTTC GCGCTTATAA GTTACAAGAA GAAGGCTTCG ATACTGTAGA AGCAAACGAA 
AAACTTGGGT TTCCCGCTGA CCTTCGTGAT TACGGTATCG GCGCTCAAAT ATTAAAAGAT 
TTAGGTTTAC AACATTTACG ATTATTAACG AATAATCCAA GAAAAATCGC TGGCTTACAA 
GGTTACGATT TAACCGTTAC GGAGCGCGTA CCGTTGCAAA TGCCAGCAAA AGAAGAGAAT 
AAAACGTATT TACAAACGAA AGTAAACAAA TTAGGACATT TATTAAACTT ATAA

Protein sequence

MFHRIEEALE DLKQGKVVIV CDDENRENEG DFIALAEYIT PETINFMITH GRGLVCVPIT 
EGYAERLQLE PMVSHNTDSH HTAFTVSIDH VSTTTGISAH ERATTIQQLL NPASKGADFN 
RPGHIFPLIA KEGGVLRRAG HTEAAVDLAQ LCGAEPAGVI CEIINEDGTM ARVPDLLQCA 
KQFDIKMITI EDLIAYRRHH ETLVTREVEI TLPTDFGTFQ AIGYSNSLDT KEHIALVKGD 
ISTGEPVLVR VHSECLTGDV FGSCRCDCGP QLHAALAQIE REGKGVLLYM RQEGRGIGLL 
NKLRAYKLQE EGFDTVEANE KLGFPADLRD YGIGAQILKD LGLQHLRLLT NNPRKIAGLQ 
GYDLTVTERV PLQMPAKEEN KTYLQTKVNK LGHLLNL