Gene EcSMS35_3099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3099
Symbol	ansB
ID	6146057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3186489
End bp	3187535
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	53%
IMG OID	641617967
Product	L-asparaginase II
Protein accession	YP_001745118
Protein GI	170682068
COG category	[E] Amino acid transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0252] L-asparaginase/archaeal Glu-tRNAGln amidotransferase subunit D
TIGRFAM ID	[TIGR00520] L-asparaginases, type II

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.00149168
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAGTTTT TCAAAAAGAC GGCACTTGCC GCACTGGTTA TGGGTTTTAG TGGTGCAGCA 
TTGGCATTAC CCAATATCAC CATTTTAGCA ACCGGCGGGA CCATTGCCGG TGGTGGTGAC 
TCCGCAACCA AATCTAACTA CACAGCGGGT AAAGTTGGCG TAGAAAATCT GGTTAATGCG 
GTGCCGCAAC TGAAGGACAT TGCGAACGTT AAAGGCGAGC AGGTAGTGAA TATCGGCTCC 
CAGGACATGA ACGATAATGT CTGGCTGACA CTGGCGAAAA AAATTAACAC CGACTGCGAT 
AAAACCGACG GCTTCGTCAT TACCCACGGT ACCGACACGA TGGAAGAAAC CGCTTACTTC 
CTCGACCTGA CGGTGAAATG CGACAAACCG GTGGTGATGG TCGGCGCAAT GCGCCCGTCC 
ACGTCCATGA GCGCAGACGG TCCATTCAAC CTGTATAACG CGGTAGTGAC CGCAGCTGAT 
AAAGCCTCCG CTAATCGTGG CGTGCTGGTT GTGATGAACG ACACCGTACT GGACGGTCGC 
GATGTCACCA AAACCAACAC CACCGACGTA GCGACCTTCA AGTCTGTTAA CTACGGTCCT 
CTGGGATACA TTCACAACGG TAAGATTGAC TACCAACGTA CCCCGGCACG TAAGCACACC 
AGCGATACGC CATTCGATGT CTCTAAGCTG AATGAGCTGC CGAAAGTCGG CATCGTTTAT 
AACTACGCTA ACGCATCCGA TCTTCCGGCT AAAGCACTGG TAGATGCGGG CTATGATGGC 
ATCGTTAGCG CTGGTGTGGG TAATGGTAAC CTGTATAAAT CTGTGTTCGA CACGCTGGCG 
ACCGCCGCGA AAAACGGCAC TGCAGTCGTG CGTTCTTCCC GCGTACCGAC GGGCGCTACC 
ACTCAGGATG CCGAAGTGGA TGATGCGAAA TACGGCTTCG TCGCCTCTGG CACGCTGAAC 
CCGCAAAAAG CGCGCGTCCT GCTGCAGCTG GCTCTGACGC AAACCAAAGA TCCGCAGCAG 
ATCCAGCAGA TCTTCAATCA GTACTAA

Protein sequence

MEFFKKTALA ALVMGFSGAA LALPNITILA TGGTIAGGGD SATKSNYTAG KVGVENLVNA 
VPQLKDIANV KGEQVVNIGS QDMNDNVWLT LAKKINTDCD KTDGFVITHG TDTMEETAYF 
LDLTVKCDKP VVMVGAMRPS TSMSADGPFN LYNAVVTAAD KASANRGVLV VMNDTVLDGR 
DVTKTNTTDV ATFKSVNYGP LGYIHNGKID YQRTPARKHT SDTPFDVSKL NELPKVGIVY 
NYANASDLPA KALVDAGYDG IVSAGVGNGN LYKSVFDTLA TAAKNGTAVV RSSRVPTGAT 
TQDAEVDDAK YGFVASGTLN PQKARVLLQL ALTQTKDPQQ IQQIFNQY