Gene BAS5126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS5126
Symbol
ID	2847878
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	5010632
End bp	5011906
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	32%
IMG OID	637508381
Product	glycosyl transferase, group 1 family protein
Protein accession	YP_031365
Protein GI	49188112
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACAGA AGAAAGTGTG CATGTTTGTA TGGAATCACT TCACAAATGA TGCACGTGTA 
TTAAGAGAAT GTACAGCCTT AGCAGAATCT GGATATGAGG TTGATTTAAT TTGTATTCAC 
GATTGGAAAC AAGAGGATCT TCCTTTATGG GAAAAACGTC AAGAGGGCTT TACAGTAACT 
CGTGTGAAGA ATAGAGTACC AGTATTACAG AAAATATTTG GGTTGGCTAA ACGTGCCAAA 
AGAGTGGCGA TGAAAAATAT CGCTACAATG ACTGTACTTG GTCTACTATT GGCATTAGGA 
ATTTGGAAGT TCCCTATGAT AACAGTTAGT TTATTATTAC TAGCTTTATT ATTTTCGCAG 
AGAAAGGTTG CTACTTTATT GGTGAGAGGA GCAATTTTGT TTAGGATGGT TCGAGCGGGA 
TTAAAAAAGA AGTATGATAT ATATCACTCG AACGATTTAA ATACATTACC GCAAGGGTTT 
ATATGTGCGA AAATATTGAG AAGGAAAAAG TTAATTTATG ATTCTCATGA AGTACAGACG 
AGTAGGACGG GATATAACAG TAATATTTAT GGGGTCATGG AGAAATTTTT TATTAAATTT 
TGTGATGTAA TGATTATGGA AAATCATACA AGAGCAAAGT ATATAGAAGA ATTATATGGA 
TTTTATCCAA AAGTCATTCA TAATTATCCA TTTGTTTCGC GTCCGGAACT GAGTAAATCA 
ATTGATTTAC ATGGAATATT AAATATTTCA CAAGATGAAC CGATTCTTTT ATATCAAGGT 
GGAATTCAAA TTGGACGTGG TCTTGATAAA TTGGTACAAG CAGTTCCTTT ATTTAAACGA 
GGTGTTGTGG TATTCATTGG AGATGGTCGT ATCAAACCTG AATTGAAAAA AATGGTAAAA 
GAAATGGAAT TAGAAGATCG AGTAAAGTTT ATACCAAAAG TGCCCGTACA GGATTTAATT 
CATTATACAA AAAATGCTTA TTTAGGATTT CAAGTATTAA ATAATGTTTG TTTTAACCAT 
TATTCTGCTT CTTCTAATAA ATTATTTGAA TATATGATGA GTGGTGTACC TGTAGTTGCT 
TGTAGTTTTC CTGAAATTCA AGGTGTAGTT GAAAAAGAAA ACATAGGAGT TTGTGTTGAC 
TCGCATGATC CAGTTTCAAT TGCTGATGGG GTAAACTACT TATTAAATAA TCAGGATGAT 
AGGGAAAAAA TGATGGTAAA TTGTTTAAGT GCAAGGGAAA AGTATAATTG GCAAAGAGAA 
AAAAGGATTT TATAA

Protein sequence

MSQKKVCMFV WNHFTNDARV LRECTALAES GYEVDLICIH DWKQEDLPLW EKRQEGFTVT 
RVKNRVPVLQ KIFGLAKRAK RVAMKNIATM TVLGLLLALG IWKFPMITVS LLLLALLFSQ 
RKVATLLVRG AILFRMVRAG LKKKYDIYHS NDLNTLPQGF ICAKILRRKK LIYDSHEVQT 
SRTGYNSNIY GVMEKFFIKF CDVMIMENHT RAKYIEELYG FYPKVIHNYP FVSRPELSKS 
IDLHGILNIS QDEPILLYQG GIQIGRGLDK LVQAVPLFKR GVVVFIGDGR IKPELKKMVK 
EMELEDRVKF IPKVPVQDLI HYTKNAYLGF QVLNNVCFNH YSASSNKLFE YMMSGVPVVA 
CSFPEIQGVV EKENIGVCVD SHDPVSIADG VNYLLNNQDD REKMMVNCLS AREKYNWQRE 
KRIL