Gene SbBS512_E3389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3389
Symbol	ansB
ID	6272479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3152905
End bp	3153951
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	52%
IMG OID	641727280
Product	L-asparaginase II
Protein accession	YP_001881730
Protein GI	187732586
COG category	[E] Amino acid transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0252] L-asparaginase/archaeal Glu-tRNAGln amidotransferase subunit D
TIGRFAM ID	[TIGR00520] L-asparaginases, type II

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGTTTT TCAAAAAGAC GGCACTTGCC GCACTGGTTA TGGGTTTTAG TGGTGCAGCA 
TTGGCATTAC CCAATATCAC CATTTTAGCA ACCGGCGGGA CCATTGCCGG TGGTGGTGAC 
TCCGCAACCA AATCTAACTA CACAGCGGGT AAAGTTGGCG TAGAAAATCT GGTTAATGCG 
GTGCCGCAAC TAAAAGACAT TGCGAACGTT AAAGGCGAGC AGGTAGTGAA TATCGGCTCC 
CAGGACATGA ACGATAATGT CTGGCTGACA CTGGCGAAAA AAATTAACAC CGACTGCGAT 
AAAACCGACG GCTTCGTCAT TACCCACGGT ACCGACACGA TGGAAGAAAC CGCTTACTTC 
CTCGACCTGA CGGTGAAATG CGACAAACCG GTGGTGATGG TCGGCGCAAT GCGCCCGTCC 
ACGTCCATGA GCGCAGACGG TCCATTCAAC CTGTATAACG CGGTAGTGAC CGCAGCTGAT 
AAAGCATCCG CTAATCGTGG CGTGCTGGTG GTGATGAACG ACACTGTACT GGACGGTCGC 
GATGTAACCA AAACCAACAC CACCGACGTA GCGACCTTCA AGTCTGTTAA CTACGGTCCT 
CTGGGATACA TTCACAACGG TAAGATTGAC TACCAACGTA CCCCGGCACG TAAGCACACC 
AGCGATACGC CATTCGATGT CTCTAAGCTG AATGAGCTGC CGAAAGTCGG CATCGTTTAT 
AACTACGCTA ACGCATCCGA TCTTCCGGCT AAAGCACTGG TAGATGCGGG CTATGATGGC 
ATCGTTAGCG CTGGTGTGGG TAATGGTAAC CTGTATAAAT CCGTGTTCGA CACCCTGGCA 
ACCGCCGCGA AAAACGGCAC TGCAGTAGTG CGTTCTTCCC GCGTACCGAC GGGTGCTACC 
ACTCAGGATG CTGAAGTGGA TGATGCGAAA TACGGCTTCG TCGCCTCTGG CACGCTGAAC 
CCGCAAAAAG CGCGCGTCCT GCTGCAGCTG GCTCTGACGC AAACCAAAGA TCCGCAGCAG 
ATCCAGCAGA TCTTCAATCA GTACTAA

Protein sequence

MEFFKKTALA ALVMGFSGAA LALPNITILA TGGTIAGGGD SATKSNYTAG KVGVENLVNA 
VPQLKDIANV KGEQVVNIGS QDMNDNVWLT LAKKINTDCD KTDGFVITHG TDTMEETAYF 
LDLTVKCDKP VVMVGAMRPS TSMSADGPFN LYNAVVTAAD KASANRGVLV VMNDTVLDGR 
DVTKTNTTDV ATFKSVNYGP LGYIHNGKID YQRTPARKHT SDTPFDVSKL NELPKVGIVY 
NYANASDLPA KALVDAGYDG IVSAGVGNGN LYKSVFDTLA TAAKNGTAVV RSSRVPTGAT 
TQDAEVDDAK YGFVASGTLN PQKARVLLQL ALTQTKDPQQ IQQIFNQY