Gene ECD_03002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03002
Symbol	agaA
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	3148990
End bp	3150123
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	58%
IMG OID
Product	N-acetylgalactosamine-6-phosphate deacetylase
Protein accession	ACT44806
Protein GI	253979136
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACACG TTCTGCGCGC CAGAAGGCTG CTGACTGAAG AGGGATGGCT CGATGACCAT 
CAGTTGCGTA TTGCTGACGG TGTCATCGCA GCAATCGAAC CGATTCCAGC GGGCGTGACT 
GAACGCGATG CGGAACTGCT CTGCCCTGCT TACATCGACA CCCATGTACA CGGTGGTGCG 
GGCGTTGATG TAATGGATGA CGCGCCGGAT GTACTCGACA AGCTGGCAAT GCACAAGGCA 
CGCGAAGGTG TCGGCAGTTG GTTACCGACC ACCGTAACCG CGCCGCTTAA TACCATTCAT 
GCGGCGCTGA AACGTATTGC TCAACGTTGC CAACGCGGCG GACCTGGTGC GCAAGTGCTG 
GGGAGTTATC TCGAAGGACC GTACTTCACG CCGCAGAATA AAGGCGCGCA TCCGCCGGAG 
TTGTTTCGCG AGCTTGAAAT TGCCGAGCTG GATCAGTTGA TTGCCGTTTC TCAGCACACC 
TTACGCGTGG TAGCGCTGGC ACCGGAAAAA GAGGGGGCAT TGCAGGCCAT CCGCCATCTT 
AAACAGCAAA ATGTACGAGT GATGCTGGGG CATAGCGCGG CGACCTGGCA ACAAACTCGC 
GCCGCGTTTG ATGCTGGTGC CGACGGCCTG GTGCATTGCT ATAACGGGAT GACAGGTTTA 
CATCACCGCG AACCGGGAAT GGTTGGCGCG GGATTAACGG ACAAGCGCGC CTGGCTGGAA 
CTGATAGCCG ATGGTCATCA TGTGCATCCG GCGGCGATGT CGCTGTGTTG TTGCTGTGCA 
AAAGAGAGAA TCGTGATGAT CACCGACGCG ATGCAGGCAG CCGGGATGCC GGATGGTCGC 
TATACGTTAT GTGGCGAAGA AGTGCAGATG CACGGTGGCG TTGTCCGTAC CGCGTCCGGT 
GGGCTGGCGG GCAGTACGCT GTCTGTTGAT GCGGCAGTGC GCAACATGGT CGAGTTGACG 
GGCGTAACGC CTGCGGAAGC CATTCATATG GCATCGCTGC ATCCGGCGCG AATGCTGGGT 
GTTGATGGTG TTCTGGGATC GCTTAAACCG GGCAAACGCG CCAGCATCGT TGCGCTGGAT 
AGCGGGCTGC ATGTGCAACA AATCTGGATT CAGAGTCAAT TAGCTTCGTT TTGA

Protein sequence

MTHVLRARRL LTEEGWLDDH QLRIADGVIA AIEPIPAGVT ERDAELLCPA YIDTHVHGGA 
GVDVMDDAPD VLDKLAMHKA REGVGSWLPT TVTAPLNTIH AALKRIAQRC QRGGPGAQVL 
GSYLEGPYFT PQNKGAHPPE LFRELEIAEL DQLIAVSQHT LRVVALAPEK EGALQAIRHL 
KQQNVRVMLG HSAATWQQTR AAFDAGADGL VHCYNGMTGL HHREPGMVGA GLTDKRAWLE 
LIADGHHVHP AAMSLCCCCA KERIVMITDA MQAAGMPDGR YTLCGEEVQM HGGVVRTASG 
GLAGSTLSVD AAVRNMVELT GVTPAEAIHM ASLHPARMLG VDGVLGSLKP GKRASIVALD 
SGLHVQQIWI QSQLASF