Gene BAS2458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS2458
Symbol
ID	2849293
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	2457350
End bp	2458528
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	32%
IMG OID	637505705
Product	glycosyl transferase
Protein accession	YP_028718
Protein GI	49185466
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID	[TIGR01426] glycosyltransferase, MGT family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.091231
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTAAATA TTTTAATGAT TAATTTGCCA GCAGAGGGAC ATGTAAACCC GACATTAAGT 
TTAGTCAAAG CCTTTACTGA ACGGGGGGAT CACGTACACT ATATTACAAC AGAACACTTT 
AAAGGCAGAA TTGAAGATTT GGGAGCTACT GTATATACCC ATCCAGATTT ATTAAAGGAT 
ATTTCTATTG ATACTGAAAC TTCATATGGA TTGAACTCTT TCTTTCATGT ACATGTTCAA 
ACTTCTTTAT ATATATTAGA AATTACGAAA CAATTATGTG AAAGCATTAA TTTTGATTTC 
GTAATTTATG ATATATTTGG TGCTGGAGAG TTAGTAAAGG AGTATTTACA AATTCCAGGC 
ATAGTTTCTT CTCCTATATT TTTAATTCCT ACTGAATTTT TGGAGACTTT ACCTTTTCAT 
CCTAATGCAG AAATACCATT CCAACCTGAT GAAATTTCTG AACAGTTACT ATATCGAATG 
GAACATGAAT TTGGAGTAAA GCCTAAAAAC AATCTTCAAT TTATGCATAA CAAGGGAGAT 
ATTACTCTTG TGTACACAAG TCGTTACTTC CAACCTAATA GCGATTTGTT TGGAGAAAAT 
AACATTTTTA TTGGACCAAG TATTTCAAAG CGTAAAACAA ATGTAGAGTT TCCACTTGAA 
TTGCTTAAAG GTAAGAAAGT TATTTATATT TCAATGGGGA CACTGCTTGA AGGACTTGAA 
CCATTCTTTA ATACTTGTAT TGATACTTTC TCAGATTTTA AAGGGGTAGT TGTAATGGCA 
ATTGGTGATA GAAATGATCG TTCTAAAATT AAGAAAGCGC CAGACAATTT TATAATTGCT 
TCATACGTAC TCCAATCAGA AATATTAAAT GAAGCAGATG TTTTTATTAC ACATGGCGGC 
ATGAACAGTG TACACGACGC TATTTATTTT AATGTCCCAT TTGTCATCAT TCCACATGAT 
AAAGATCAAC CGATGATAGC ACAAAGATTA ACTGAGCTTG AAGCCGCACA TAGGTTATTG 
AAAGAGCATG TTAATGTACA AAGTTTAAAA GAAGCGGTAA CAGACGTACT TTTAAATGAA 
AAGTATAAAC ATGGTATACG AAAATTAAAA GATAGCTTTT TACAATGTGG TGGTGCAAAA 
GAAGCAATCT CAGTTATTAA ATCTCTATTA AATAAATAG

Protein sequence

MLNILMINLP AEGHVNPTLS LVKAFTERGD HVHYITTEHF KGRIEDLGAT VYTHPDLLKD 
ISIDTETSYG LNSFFHVHVQ TSLYILEITK QLCESINFDF VIYDIFGAGE LVKEYLQIPG 
IVSSPIFLIP TEFLETLPFH PNAEIPFQPD EISEQLLYRM EHEFGVKPKN NLQFMHNKGD 
ITLVYTSRYF QPNSDLFGEN NIFIGPSISK RKTNVEFPLE LLKGKKVIYI SMGTLLEGLE 
PFFNTCIDTF SDFKGVVVMA IGDRNDRSKI KKAPDNFIIA SYVLQSEILN EADVFITHGG 
MNSVHDAIYF NVPFVIIPHD KDQPMIAQRL TELEAAHRLL KEHVNVQSLK EAVTDVLLNE 
KYKHGIRKLK DSFLQCGGAK EAISVIKSLL NK