Gene EcHS_A3117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3117
Symbol	ansB
ID	5593714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3128600
End bp	3129646
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	53%
IMG OID	640922236
Product	L-asparaginase II
Protein accession	YP_001459736
Protein GI	157162418
COG category	[E] Amino acid transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0252] L-asparaginase/archaeal Glu-tRNAGln amidotransferase subunit D
TIGRFAM ID	[TIGR00520] L-asparaginases, type II

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGTTTT TCAAAAAGAC GGCACTTGCC GCACTGGTTA TGGGTTTTAG TGGTGCAGCA 
TTGGCATTAC CCAATATCAC CATTTTAGCA ACCGGCGGGA CCATTGCCGG TGGTGGTGAC 
TCCGCAACCA AATCTAACTA CACAGCGGGT AAAGTTGGCG TAGAAAATCT GGTTAATGCG 
GTGCCGCAAC TAAAAGACAT TGCGAACGTT AAAGGCGAGC AGGTAGTGAA TATCGGCTCC 
CAGGACATGA ACGATAATGT CTGGCTGACA CTGGCGAAAA AAATTAACAC CGACTGCGAT 
AAAACCGACG GCTTCGTCAT TACCCACGGT ACCGACACGA TGGAAGAAAC CGCTTACTTC 
CTCGACCTGA CGGTGAAATG CGACAAACCG GTGGTGATGG TCGGCGCAAT GCGCCCGTCC 
ACGTCCATGA GCGCAGACGG TCCATTCAAC CTGTATAACG CGGTAGTGAC CGCAGCTGAT 
AAAGCCTCCG CTAATCGTGG CGTGCTGGTG GTGATGAACG ACACCGTACT GGACGGTCGC 
GATGTCACCA AAACCAACAC CACCGACGTA GCGACCTTCA AGTCTGTTAA CTACGGTCCT 
CTGGGATACA TTCACAACGG TAAGATTGAC TACCAACGTA CCCCGGCACG TAAGCACACC 
AGCGATACGC CATTCGATGT CTCTAAGCTG AATGAGCTGC CGAAAGTCGG CATCGTTTAT 
AACTACGCTA ACGCATCCGA TCTTCCGGCT AAAGCACTGG TAGATGCGGG CTATGATGGC 
ATCGTTAGCG CTGGTGTGGG TAATGGTAAC CTGTATAAAT CCGTGTTCGA CACCCTGGCA 
ACCGCCGCGA AAAACGGCAC TGCAGTAGTG CGTTCTTCCC GCGTACCGAC GGGTGCTACC 
ACTCAGGATG CTGAAGTGGA TGATGCGAAA TACGGCTTCG TCGCCTCTGG CACGCTGAAC 
CCGCAAAAAG CGCGCGTCCT GCTGCAGCTG GCTCTGACGC AAACCAAAGA TCCGCAGCAG 
ATCCAGCAGA TCTTCAATCA GTACTAA

Protein sequence

MEFFKKTALA ALVMGFSGAA LALPNITILA TGGTIAGGGD SATKSNYTAG KVGVENLVNA 
VPQLKDIANV KGEQVVNIGS QDMNDNVWLT LAKKINTDCD KTDGFVITHG TDTMEETAYF 
LDLTVKCDKP VVMVGAMRPS TSMSADGPFN LYNAVVTAAD KASANRGVLV VMNDTVLDGR 
DVTKTNTTDV ATFKSVNYGP LGYIHNGKID YQRTPARKHT SDTPFDVSKL NELPKVGIVY 
NYANASDLPA KALVDAGYDG IVSAGVGNGN LYKSVFDTLA TAAKNGTAVV RSSRVPTGAT 
TQDAEVDDAK YGFVASGTLN PQKARVLLQL ALTQTKDPQQ IQQIFNQY