Gene EcolC_1865 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1865
Symbol	ansA
ID	6064843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2064814
End bp	2065830
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	51%
IMG OID	641601278
Product	cytoplasmic asparaginase I
Protein accession	YP_001724840
Protein GI	170019886
COG category	[E] Amino acid transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0252] L-asparaginase/archaeal Glu-tRNAGln amidotransferase subunit D
TIGRFAM ID	[TIGR00519] L-asparaginases, type I

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.281005
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000416053
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCAAAAGA AATCAATTTA CGTTGCCTAC ACGGGCGGGA CCATCGGGAT GCAGCGTTCC 
GAGCAGGGTT ATATACCGGT GTCAGGTCAT CTACAACGCC AACTGGCGCT GATGCCGGAA 
TTCCATCGCC CGGAGATGCC AGATTTCACC ATTCATGAAT ATACGCCGCT GATGGATTCT 
TCTGATATGA CGCCAGAAGA CTGGCAGCAT ATTGCTGAAG ATATTAAAGC GCACTATGAC 
GACTATGATG GTTTTGTCAT TCTGCACGGC ACCGACACGA TGGCGTATAC CGCCTCTGCG 
CTGTCGTTCA TGCTCGAAAA TCTCGGTAAA CCGGTCATTG TGACAGGGTC ACAAATCCCG 
CTGGCTGAGT TACGCTCTGA CGGACAAATT AATCTGCTGA ATGCGTTGTA CGTTGCGGCG 
AATTATCCGA TCAACGAAGT AACGCTCTTT TTTAATAATC GACTGTATCG CGGCAACCGC 
ACCACCAAAG CCCATGCCGA TGGTTTTGAT GCGTTTGCCT CTCCAAACCT TCCTCCGTTA 
CTGGAAGCAG GTATCCATAT ACGTCGTTTG AATACGCCAC CCGCCCCGCA CGGTGAAGGG 
GAATTGATCG TTCATCCAAT CACGCCACAA CCAATTGGCG TAGTGACGAT TTATCCGGGG 
ATTTCTGCTG ACGTCGTGCG CAATTTTCTG CGCCAACCGG TGAAAGCATT GATTCTGCGC 
TCATATGGCG TGGGTAATGC GCCACAAAAC AAAGCCTTCC TGCAGGAATT ACAAGAAGCC 
AGCGATCGCG GTATTGTGGT GGTCAACCTG ACACAATGTA TGTCCGGTAA AGTGAACATG 
GGTGGTTATG CCACCGGTAA CGCCCTCGCC CATGCCGGCG TTATTGGCGG TGCAGATATG 
ACTGTAGAAG CCACGCTAAC CAAACTGCAT TACCTGCTGA GCCAGGAACT GGATACTGAA 
ACCATTCGCA AGGCCATGAG CCAAAACCTG CGCGGCGAAC TGACGCCGGA TGATTAA

Protein sequence

MQKKSIYVAY TGGTIGMQRS EQGYIPVSGH LQRQLALMPE FHRPEMPDFT IHEYTPLMDS 
SDMTPEDWQH IAEDIKAHYD DYDGFVILHG TDTMAYTASA LSFMLENLGK PVIVTGSQIP 
LAELRSDGQI NLLNALYVAA NYPINEVTLF FNNRLYRGNR TTKAHADGFD AFASPNLPPL 
LEAGIHIRRL NTPPAPHGEG ELIVHPITPQ PIGVVTIYPG ISADVVRNFL RQPVKALILR 
SYGVGNAPQN KAFLQELQEA SDRGIVVVNL TQCMSGKVNM GGYATGNALA HAGVIGGADM 
TVEATLTKLH YLLSQELDTE TIRKAMSQNL RGELTPDD