Gene BAS3345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS3345
Symbol
ID	2850912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3315927
End bp	3317231
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	36%
IMG OID	637506589
Product	inosine-uridine preferring nucleoside hydrolase family protein
Protein accession	YP_029602
Protein GI	49186350
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1957] Inosine-uridine nucleoside N-ribohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.117595
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTAAAT TTATTTTCTT TCGGTGGATT AGAAGCAGCA TTCATTTGGC CGATTGTATT 
AGGGTTATAT TGGAGGAAAG GAAATGCAAC AGGAGCGCTT GCCTCCATTT TAGTTGGAGT 
AAGCTCATAT ATGTGCATTC ATCTTTTCTA TCCAAATCCG TTCGGTATAC ATACAGTTGT 
CTTCCCGATT TGTTTTGCGT TTATCGCTTA TATCTTAGGA AGCATGGTTG CTGTGAAGAA 
AAACAGTATA GGTTAGATGA AAAACGTAGT CCTTACAGGA CTGCGTTTTT TCGTATAAAT 
TTGTTCTTTT TATTCTGTAA TCCTGTGAAT ATTCATAAAT TAATAACAAT TGAGGGGATG 
GAGTTGAGGG CGATGAAAAA AGTATTATTT TTAGGAGACC CAGGAATTGA TGACTCTTTA 
GCAATTATGT ATGGATTGTT GCATCCTGAT ATTGATATTG TTGGTGTAGT AACTGGATAT 
GGAAATGTAA CGCAAGAAAA GGCGACAAGT AATGCGGCAT ATTTATTGCA ACTGGCAGGA 
CGGGAAGATA TACCTATTAT TAATGGTGCG AAAATCCCTT TATCTGGAGA TATTACAACG 
TATTATCCAG AAATTCATGG GGCGGAAGGC TTAGGACCAA TTCGACCGCC GAAAAATCTT 
TCTCCAAATA TAAGGCCTTT TTGTGAGTTT TTTGACATTC TTGAAAAATA TAAAGGAGAA 
TTAATTATAG TTGATGCTGG GAGGTCAACG ACACTTGCAA CAGCATTTAT TTTAGAAAAA 
CCATTGATGA AGTATGTGAA AGAATATTAT ATAATGGGCG GTGCTTTTTT AATGCCTGGA 
AATGTTACAC CAGTCGCAGA AGCGAATTTT CATGGTGACC CTATTGCATC ACAATTAGTC 
ATGCAAAATG CCAAGAATGT GACGTTGGTG CCGCTGAATG TTACATCTGA AGCTATAATC 
ACGCCAGAGA TGGTAAAGTA CATTACGAAA CATTCTAAAA CGAGTTTTAA TAAATTAATT 
GAACCGATTT TTACGTATTA TTATAAAGCT TATAGAAAGT TAAATCCGAA AATAACAGGA 
AGTCCAGTAC ATGACGTTGT TACAATGATG GTCGCGGCGA ATCCTTCAAT ACTGGATTAT 
GTGTATCGTC GTGTAGATGT AGATACAGTG GGGATTGCAA AAGGAGAAAG TATTGCAGAT 
TTCCGTCCTC AACCTGATGC AAAAGCCTTA AAAAATTGGG TACGAATTGG TTGGTCATTA 
CATTATAAAA AATTCCTTGA GGATTTTGTG AAAATCATGA CGTAG

Protein sequence

MVKFIFFRWI RSSIHLADCI RVILEERKCN RSACLHFSWS KLIYVHSSFL SKSVRYTYSC 
LPDLFCVYRL YLRKHGCCEE KQYRLDEKRS PYRTAFFRIN LFFLFCNPVN IHKLITIEGM 
ELRAMKKVLF LGDPGIDDSL AIMYGLLHPD IDIVGVVTGY GNVTQEKATS NAAYLLQLAG 
REDIPIINGA KIPLSGDITT YYPEIHGAEG LGPIRPPKNL SPNIRPFCEF FDILEKYKGE 
LIIVDAGRST TLATAFILEK PLMKYVKEYY IMGGAFLMPG NVTPVAEANF HGDPIASQLV 
MQNAKNVTLV PLNVTSEAII TPEMVKYITK HSKTSFNKLI EPIFTYYYKA YRKLNPKITG 
SPVHDVVTMM VAANPSILDY VYRRVDVDTV GIAKGESIAD FRPQPDAKAL KNWVRIGWSL 
HYKKFLEDFV KIMT