Gene ECH74115_4260 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4260
Symbol	ansB
ID	6968817
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3945673
End bp	3946719
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	53%
IMG OID	643387998
Product	L-asparaginase II
Protein accession	YP_002272437
Protein GI	209397059
COG category	[E] Amino acid transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0252] L-asparaginase/archaeal Glu-tRNAGln amidotransferase subunit D
TIGRFAM ID	[TIGR00520] L-asparaginases, type II

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTTTT TCAAAAAGAC GGCACTTGCC GCACTGGTTA TGGGTTTTAG TGGTGCAGCA 
TTGGCATTAC CCAATATCAC CATTTTAGCA ACCGGCGGGA CCATTGCCGG TGGTGGTGAC 
TCCGCAACCA AATCTAACTA CACAGCGGGT AAAGTTGGCG TAGAAAATCT GGTTAATGCG 
GTGCCGCAAC TGAAGGACAT TGCGAACGTT AAAGGCGAGC AGGTAGTGAA TATCGGCTCC 
CAGGACATGA ACGATGATGT CTGGCTGACA CTGGCGAAAA AAATTAACAC CGACTGCGAT 
AAAACCGACG GCTTCGTCAT TACTCACGGT ACCGACACGA TGGAAGAAAC CGCTTACTTC 
CTCGACCTGA CGGTGAAATG CGACAAACCG GTGGTGATGG TCGGCGCAAT GCGTCCGTCC 
ACGTCTATGA GCGCAGACGG TCCATTCAAC CTGTATAACG CGGTAGTGAC CGCAGCTGAT 
AAAGCCTCCG CTAATCGTGG CGTGCTGGTG GTGATGAACG ACACCGTACT GGACGGTCGC 
GATGTCACCA AAACCAACAC CACCGACGTA GCGACCTTCA AGTCTGTTAA CTACGGTCCG 
CTGGGATACA TTCACAACGG TAAGATTGAC TACCAACGTA CCCCGGCACG TAAGCACACC 
AGCGACACGC CGTTCGATGT CTCTAAGCTG AATGAACTGC CGAAAGTCGG CATTGTTTAT 
AACTACGCTA ACGCATCCGA TCTTCCGGCT AAAGCCCTGG TAGATGCGGG CTATGATGGC 
ATCGTGAGCG CTGGTGTGGG TAACGGCAAC CTGTATAAAT CCGTGTTTGA CACGCTGGCG 
ACCGCCGCGA AAAACGGTAC TGCAGTCGTG CGTTCTTCCC GCGTACCGAC GGGCGCTACC 
ACTCAGGATG CCGAAGTGGA TGATGCGAAA TACGGTTTTA TTGCCTCTGG TACGCTGAAC 
CCGCAAAAAG CGCGCGTCCT GCTGCAACTG GCTCTGACGC AAACCAAAGA TCCGCAGCAG 
ATCCAGCAGA TCTTCAATCA GTACTAA

Protein sequence

MEFFKKTALA ALVMGFSGAA LALPNITILA TGGTIAGGGD SATKSNYTAG KVGVENLVNA 
VPQLKDIANV KGEQVVNIGS QDMNDDVWLT LAKKINTDCD KTDGFVITHG TDTMEETAYF 
LDLTVKCDKP VVMVGAMRPS TSMSADGPFN LYNAVVTAAD KASANRGVLV VMNDTVLDGR 
DVTKTNTTDV ATFKSVNYGP LGYIHNGKID YQRTPARKHT SDTPFDVSKL NELPKVGIVY 
NYANASDLPA KALVDAGYDG IVSAGVGNGN LYKSVFDTLA TAAKNGTAVV RSSRVPTGAT 
TQDAEVDDAK YGFIASGTLN PQKARVLLQL ALTQTKDPQQ IQQIFNQY