Gene SeD_A2052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2052
Symbol	ansA
ID	6875154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1984813
End bp	1985829
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	53%
IMG OID	642785166
Product	cytoplasmic asparaginase I
Protein accession	YP_002215832
Protein GI	198242806
COG category	[E] Amino acid transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0252] L-asparaginase/archaeal Glu-tRNAGln amidotransferase subunit D
TIGRFAM ID	[TIGR00519] L-asparaginases, type I

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	0.160149
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAGA AATCAATTTA CGTTGCCTAT ACCGGCGGTA CTATCGGTAT GCAGCGCTCA 
GATAAAGGGT ATATCCCGGT GTCCGGGCAC CTTCAGCGCC AGCTGGCGCT GATGCCGGAA 
TTCCACCGCC CGGAGATGCC GGATTTTACC ATCCATGAAT ATGCCCCGCT GATGGATTCA 
TCAGATATGA CGCCGGAAGA CTGGCAGCAT ATCGCTGAAG ATATCAAAGC GCACTACGAT 
GAGTATGACG GTTTTGTTAT TCTGCACGGC ACCGACACGA TGGCGTATAC CGCATCGGCG 
CTCTCTTTCA TGCTGGAAAA TCTGGGTAAA CCGGTTATTG TGACAGGGTC ACAAATTCCG 
CTGGCTGAGC TGCGCTCCGA CGGGCAAATT AATTTGCTGA ATGCGCTTTA TGTCGCCGCC 
AACTATCCTG TTAATGAAGT AACGCTGTTT TTTAATAATC GTCTGTTCCG CGGCAATCGC 
ACGACCAAAG CCCATGCGGA TGGTTTTGAC GCTTTTGCCT CTCCTAATCT GCCGCCCTTG 
CTGGAAGCAG GAATTCACAT TCGCCGTTTA AATACGCCTC CCGCGCCCTA CGGTTCTGGT 
GAATTAATCG TTCACCCTAT TACGCCGCAG CCGATAGGCG TAGTGACGAT TTATCCGGGG 
ATTTCCGCCG AGGTAGTACG TAACTTTCTG CGTCAGCCGG TAAAAGCGCT GATTCTGCGC 
TCTTATGGCG TAGGCAACGC GCCGCAAAAT AAAGCGTTTT TACAGGAGCT GAAAGAGGCC 
AGTTCGCGCG GCATCGTGGT GGTTAACCTG ACGCAATGCA TGTCAGGGCG AGTCAATATG 
GGCGGGTACG CTACCGGTAA TGCGCTGGCG CACGCTGGCG TGATTGGCGG TGCCGATATG 
ACCGTCGAAG CCACCTTAAC CAAACTGCAT TATTTGTTAA GCCAGGGTCT GGACACTCAG 
GCGATTCGTA GCGCGATGGC GCAAAACTTG CGTGGTGAAT TGACGCCGGA TGATTAA

Protein sequence

MQKKSIYVAY TGGTIGMQRS DKGYIPVSGH LQRQLALMPE FHRPEMPDFT IHEYAPLMDS 
SDMTPEDWQH IAEDIKAHYD EYDGFVILHG TDTMAYTASA LSFMLENLGK PVIVTGSQIP 
LAELRSDGQI NLLNALYVAA NYPVNEVTLF FNNRLFRGNR TTKAHADGFD AFASPNLPPL 
LEAGIHIRRL NTPPAPYGSG ELIVHPITPQ PIGVVTIYPG ISAEVVRNFL RQPVKALILR 
SYGVGNAPQN KAFLQELKEA SSRGIVVVNL TQCMSGRVNM GGYATGNALA HAGVIGGADM 
TVEATLTKLH YLLSQGLDTQ AIRSAMAQNL RGELTPDD