Gene BAS5228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS5228
Symbol
ID	2849276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	5114854
End bp	5116158
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	36%
IMG OID	637508482
Product	HD domain-containing protein
Protein accession	YP_031466
Protein GI	49188213
COG category	[R] General function prediction only
COG ID	[COG1078] HD superfamily phosphohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTATATT TAAACGACAA ACTCAGCGAA ACAAAAGTGT TTAAAGACCC GGTACATAAA 
TATGTGCACG TGCGCGATCG TGTTATTTGG GATTTAATCG GAACGAAAGA ATTTCAACGC 
TTGCGCCGTA TTAAGCAGCT TGGAACGACA TTTTTTACAT TTCACGGTGC AGAGCATAGT 
CGCTTTACTC ATTCGTTAGG TGTATATGAA ATTATTCGTC GTATGATTGA TGATGTGTTT 
GATGGCAGAC CGAACTGGAA TGCTGAAGAT AGATTGTTAT GCTTATGTGC GGCATTACTT 
CATGATGTCG GTCACGGCCC ATTTTCTCAT TCGTTTGAGA AAGTATTTTC ATTAGATCAT 
GAGAAATTTA CGCAAAAGAT TATCGTTGGA GATACAGAAA TTAATCGCGT ATTAAGTCGT 
GTGGATAAAG ACTTTCCGCA AAAGGTAGCG GATGTAATCG CAAAAACATC TAATAATAAA 
TTAGCGATTA GCATGATTTC CAGTCAAATT GATGCAGATC GCATGGACTA CTTATTAAGA 
GATGCGTATT TTACTGGCGT AAAGTATGGA AACTTTGATA TGGAACGTAT ACTGCGCGTT 
ATGCGTCCGT ACGGAAATCA AGTAGTTATT AAAAATAGTG GTATGCATGC TGTTGAACAT 
TATATTATGA GTCGTTATCA AATGTACTGG CAAGTATATT TCCATCCAGT AACACGCAGT 
GCTGAAGTTA TTTTAACGAA GATTTTACAC CGTGCAAAAT CATTGCACGA GAAGTACTAT 
ACATTTAAAA ATCATCCGGT TCATTTCTAT TCTTTATTTG AAGAAGAAGT AACAGTAGAG 
GATTATTTAA AGTTAGACGA GAACGTTATG TATTATTACT TCCAAGTATG GCAAGACGAA 
GAGGATCCAA TTTTAAGTGA TTTATGTCGC CGTTTTATGA ATCGAAACCT ATTTAAATAT 
GTAGAGTTTA CAGATAAGCA CGGTTTAGAT AATTGGATGG AATTAAGTAG CTTATTCAAA 
AAGATTGGAC TTGATCCAGA ATACTATTTA GTAGTTGATT CAACATCAGA CTTACCGTAC 
GACTTTTACC GTGCTGGTGA AGAAGAAGAA CGTCTGCCAA TCTTACTTCT TATGCCAAAT 
GGAGAGCTTA GAGAGCTTTC ACGTGAATCG GATATTGTTG AGGCGATTAC TGGTAAGAAG 
AGAAGGGACC AGAAATTATT CTATCCACAT GATTTAATCT ATGAAGATGG AAGAAAAGGA 
AAATATAAAG AGAGAATCAT CGAGTTACTC GAAGGAAAAA AATAA

Protein sequence

MVYLNDKLSE TKVFKDPVHK YVHVRDRVIW DLIGTKEFQR LRRIKQLGTT FFTFHGAEHS 
RFTHSLGVYE IIRRMIDDVF DGRPNWNAED RLLCLCAALL HDVGHGPFSH SFEKVFSLDH 
EKFTQKIIVG DTEINRVLSR VDKDFPQKVA DVIAKTSNNK LAISMISSQI DADRMDYLLR 
DAYFTGVKYG NFDMERILRV MRPYGNQVVI KNSGMHAVEH YIMSRYQMYW QVYFHPVTRS 
AEVILTKILH RAKSLHEKYY TFKNHPVHFY SLFEEEVTVE DYLKLDENVM YYYFQVWQDE 
EDPILSDLCR RFMNRNLFKY VEFTDKHGLD NWMELSSLFK KIGLDPEYYL VVDSTSDLPY 
DFYRAGEEEE RLPILLLMPN GELRELSRES DIVEAITGKK RRDQKLFYPH DLIYEDGRKG 
KYKERIIELL EGKK