Gene BAS5117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS5117
Symbol
ID	2850827
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	4997513
End bp	4998628
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	39%
IMG OID	637508372
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_031356
Protein GI	49188103
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.200272
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGAAC GTTTAAAAGT AATGACGATT TTTGGGACAC GTCCAGAAGC AATTAAAATG 
GCACCTCTTG TATTAGAGTT GCAAAAGCAT CCAGAGAAAA TTGAGTCAAT TGTGACTGTA 
ACAGCGCAAC ATCGTCAAAT GTTAGACCAA GTATTAAGTA TCTTTGGAAT TACACCAGAT 
TTCGATTTGA ATATTATGAA GGATCGCCAA ACTTTAATTG ATATTACAAC GCGTGGTTTA 
GAAGGTTTGG ATAAAGTAAT GAAAGAAGCA AAGCCGGATA TCGTACTTGT ACATGGTGAT 
ACAACGACAA CGTTTATCGC AAGCTTAGCT GCTTTCTATA ATCAAATTCC AGTAGGTCAT 
GTCGAGGCGG GACTTCGTAC ATGGGATAAA TATTCTCCAT ACCCAGAAGA GATGAATCGT 
CAATTAACAG GCGTAATGGC GGACCTTCAT TTCTCACCTA CAGCAAAATC GGCAACGAAC 
TTACAGAAAG AAAATAAAGA TGAGTCACGC ATTTTCATAA CAGGAAATAC AGCGATTGAC 
GCACTAAAAA CGACTGTAAA AGAAACATAT AGTCATCCCG TACTAGAGAA ACTTGGAAAT 
AATCGTCTTG TACTTATGAC AGCTCACCGT CGTGAAAACT TAGGAGAGCC AATGCGTAAT 
ATGTTCCGTG CAATTAAGCG TCTTGTTGAT AAGCATGAAG ACGTACAAGT TGTATATCCT 
GTTCATATGA ATCCTGTTGT TCGTGAAACT GCAAATGATA TTTTAGGCGA TTATGGCCGC 
ATTCATTTAA TTGAGCCGTT AGATGTAATT GATTTCCACA ATGTTGCAGC TCGTTCATAC 
TTAATGTTAA CTGATTCTGG TGGGGTACAA GAGGAAGCAC CGTCACTTGG TGTACCGGTT 
CTTGTTCTTC GTGATACAAC GGAGCGTCCA GAAGGTATTG AAGCAGGTAC GTTGAAATTA 
GCGGGAACAG ACGAAGAGAC AATCTTTAGT CTTGCTGATG AGTTGTTATC AGACAAAGAA 
GCTCATGATA AGATGTCAAA AGCATCTAAC CCGTACGGTG ATGGCCGTGC ATCAGAGCGT 
ATTGTAGAAG CAATTTTAAA ACACTTTAAT AAGTAA

Protein sequence

MTERLKVMTI FGTRPEAIKM APLVLELQKH PEKIESIVTV TAQHRQMLDQ VLSIFGITPD 
FDLNIMKDRQ TLIDITTRGL EGLDKVMKEA KPDIVLVHGD TTTTFIASLA AFYNQIPVGH 
VEAGLRTWDK YSPYPEEMNR QLTGVMADLH FSPTAKSATN LQKENKDESR IFITGNTAID 
ALKTTVKETY SHPVLEKLGN NRLVLMTAHR RENLGEPMRN MFRAIKRLVD KHEDVQVVYP 
VHMNPVVRET ANDILGDYGR IHLIEPLDVI DFHNVAARSY LMLTDSGGVQ EEAPSLGVPV 
LVLRDTTERP EGIEAGTLKL AGTDEETIFS LADELLSDKE AHDKMSKASN PYGDGRASER 
IVEAILKHFN K