Gene EcSMS35_4112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4112
Symbol	asnA
ID	6144321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4206954
End bp	4207946
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	56%
IMG OID	641618936
Product	asparagine synthetase AsnA
Protein accession	YP_001746074
Protein GI	170683630
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2502] Asparagine synthetase A
TIGRFAM ID	[TIGR00669] aspartate--ammonia ligase, AsnA-type

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0106172
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.169697
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCG CTTACATTGC CAAACAACGT CAAATTAGCT TCGTGAAATC TCACTTTTCC 
CGTCAACTGG AAGAACGCTT AGGGCTGATT GAAGTCCAGG CGCCGATTCT TAGCCGTGTG 
GGGGATGGCA CGCAGGATAA CTTGTCGGGC TGTGAAAAAG CGGTGCAGGT AAAAGTGAAA 
GCTCTGCCTG ATGCCCAGTT CGAAGTGGTT CATTCACTGG CGAAGTGGAA ACGTCAGACA 
TTAGGGCAAC ACGACTTCAG TGCGGGCGAA GGGCTTTACA CGCACATGAA AGCCCTTCGC 
CCCGATGAAG ACCGTCTTTC TCCGTTGCAC TCGGTCTATG TTGACCAGTG GGACTGGGAA 
CGCGTAATGG CCGACGGCGA GCGTCAATTC TCGACTCTGA AAAGCACGGT AGAGGCGATC 
TGGGCGGGAA TTAAAGCAAC CGAAGCTGCG GTTAGCGAAG AGTTTGGCCT GGCACCGTTC 
CTGCCGGATC AGATCCACTT CGTACACAGC CAGGAGTTAC TGTCTCGTTA TCCGAATCTT 
GATGCCAAAG GGCGTGAGCG GGCGATTGCG AAAGATCTTG GCGCGGTATT TCTCGTCGGG 
ATTGGCGGCA AGTTGAGTGA TGGCCATCGT CACGACGTGC GCGCACCGGA TTATGATGAC 
TGGAGCACCC CGTCAGAGCT GGGCTATGCG GGGCTGAACG GCGATATTCT GGTGTGGAAC 
CCGGTACTGG AAGATGCGTT TGAGCTTTCT TCCATGGGGA TCCGCGTTGA TGCCGACACG 
CTGAAGCATC AGCTGGCGCT GACCGGTGAC GAAGATCGCC TGCAACTGGA GTGGCATCAG 
GCGCTGCTGC GCGGTGAAAT GCCGCAGACC ATCGGCGGTG GTATCGGCCA GTCTCGTTTG 
ACCATGCTGC TGCTGCAACT GCCGCATATC GGCCAGGTTC AGTGTGGAGT ATGGTCAGCG 
GCAGTTCGTG AGAGCGTCCC TTCTCTGCTG TAA

Protein sequence

MKTAYIAKQR QISFVKSHFS RQLEERLGLI EVQAPILSRV GDGTQDNLSG CEKAVQVKVK 
ALPDAQFEVV HSLAKWKRQT LGQHDFSAGE GLYTHMKALR PDEDRLSPLH SVYVDQWDWE 
RVMADGERQF STLKSTVEAI WAGIKATEAA VSEEFGLAPF LPDQIHFVHS QELLSRYPNL 
DAKGRERAIA KDLGAVFLVG IGGKLSDGHR HDVRAPDYDD WSTPSELGYA GLNGDILVWN 
PVLEDAFELS SMGIRVDADT LKHQLALTGD EDRLQLEWHQ ALLRGEMPQT IGGGIGQSRL 
TMLLLQLPHI GQVQCGVWSA AVRESVPSLL