Gene BAS4740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4740
Symbol
ID	2851474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4622474
End bp	4623574
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	40%
IMG OID	637507974
Product	dihydroorotase
Protein accession	YP_030984
Protein GI	49187731
COG category	[R] General function prediction only
COG ID	[COG3964] Predicted amidohydrolase
TIGRFAM ID	[TIGR03583] probable amidohydrolase EF_0837/AHA_3915

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.185439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGAAC GATTCGTACT ACGTAATGTG AAACGTGTGA ACGGGGAAGA GATTGACATT 
GTAATTGAAA ATAATAAAAT CGCACAGGTG ACGAAAGCTG GTGCTGGCGA GGGTGGAAAG 
GTTCTTGATT ACTCAGGTAC TTACGTATCG AGTGGTTGGA TTGATTTGCA CGTTCATGCT 
TTTCCAGAGT TTGATCCGTA TGGCGATGAG GTGGACGAAA TTGGCGTTAA GCAAGGGGTA 
ACGACAATTG TTGATGCAGG TAGCTGCGGT GCTGATCGCA TTGCAGATTT AGTAAAAAGT 
AGAGAACAGG CAAAGACGAA TTTATTTGCT TTTTTAAATA TTTCTCGCAT CGGTTTGAAA 
CGAATTGATG AATTATCCAA TATGGAATGG ATCGATAAAG AGAAAGTAAT ACAAGCAGTA 
GAAAAGTATA AAGATGTAAT CGTTGGGTTA AAGGCGAGAA TGAGTAAAAG TGTCGTTTGT 
GATAGTGGAA TTGAACCGCT TCATATAGCG CGTGATTTAT CCCGTGAAAC ATCATTACCG 
ATTATGGTAC ATATCGGTTC AGCGCCCCCT CGCATTGAGG AAGTTGTACC TCTTTTAGAA 
AAAGATGATG TTATTACACA TTACTTAAAC GGGAAAGAAA ATAATTTATT TGATGAAGAA 
GGCAAACCGC TACCTGTGTT ACTAGATGCA GTGAATCGCG GTGTGCATTT AGATGTTGGG 
CATGGTAATG CTAGTTTTTC TTTTAAAGTA GCAGAGGCAG CAAAGCGTCA CGATATTGCC 
TTTCATACAA TTAGTACAGA TATTTACCGG AAGAATCGCG TGCACGGTCC AGTGTATAGT 
ATGGCTCACG TTCTTTCGAA ATTCCTTTAC TTAGGTTATC CGCTAGAAGA AGTGATTGAT 
GCGGTTACGA AACATGCGGC AGAATGGCTT AAGAAACCTG AGCTTGGCCG CATTCAAGAA 
GGAGATATTG CAAACTTAAC TTTATTTACG GTGAAAGATG AGAAGGTTAA GTTAATAGAT 
TCAGAAGGGG ATCAGCGCAT TGCTGAAAGA AGAATTGATA CGAAAGGGGT TGTAGTCAAT 
GGGTCATTCA TTGAATGCTA A

Protein sequence

MTERFVLRNV KRVNGEEIDI VIENNKIAQV TKAGAGEGGK VLDYSGTYVS SGWIDLHVHA 
FPEFDPYGDE VDEIGVKQGV TTIVDAGSCG ADRIADLVKS REQAKTNLFA FLNISRIGLK 
RIDELSNMEW IDKEKVIQAV EKYKDVIVGL KARMSKSVVC DSGIEPLHIA RDLSRETSLP 
IMVHIGSAPP RIEEVVPLLE KDDVITHYLN GKENNLFDEE GKPLPVLLDA VNRGVHLDVG 
HGNASFSFKV AEAAKRHDIA FHTISTDIYR KNRVHGPVYS MAHVLSKFLY LGYPLEEVID 
AVTKHAAEWL KKPELGRIQE GDIANLTLFT VKDEKVKLID SEGDQRIAER RIDTKGVVVN 
GSFIEC