Gene EcSMS35_1111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1111
Symbol
ID	6146345
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1125870
End bp	1126901
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	40%
IMG OID	641615992
Product	asparaginase family protein
Protein accession	YP_001743184
Protein GI	170682695
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1446] Asparaginase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAAA TAAAAGGTAT AACAGTAATG GCAGCCTTCG CATTGTGTAT AGGATATGCT 
CACGCTGAAT CTCAAACGCC AATACGCCTT GTAATTCATG GTGGAGCTGG CACCATAACA 
AAAGATACTA TTACACCTGA ACAAGAAAAA CAATACAGAG AAAAGTTAAC AGATGCACTA 
AATGCTGGGT ATGCTGTGCT TAATAGTGGA GGAAGTAGCC TTGATGCTGT TCAGCGTGCA 
ATTAATGTTA TGGAGGACTC TCCCCTCTTC AATGCTGGAA AAGGCGCTGT CTTTACTCAT 
GATGGCAAAA ACGAACTTGA TGCTGCAATT ATGGATGGAA AAACCAAAAT GGCCGGAGCC 
GTTGCAGGAG TGACGACCAT AAAAAACCCT ATAAACGCTG CTTATGCAGT TATGACTAAA 
AGCCCTCATG TATTAATGAT CTCTAATGGT GCGGAACTAT TTGCAAAAGA GCAAGGCTTA 
GTTATGGTTG AGCCAGCATA TTTCAAAACT GATTTCCGTT GGCAACAGCT ACAGAACGCT 
TTAAAAGACG AAAAAATAAC CCTTGATCAT AATGGTAAAT CAGCATCTCT TTTACTCCCC 
CCAAAGAACT ACGACTATAA ATATGGAACT GTTGGAGCAG TCGCGTTGGA CAAAGATGGT 
AATCTGGCAG CTGGAACATC AACAGGAGGT ATGACAAATA AACGTTACGG ACGCGTAGGT 
GACTCGCCAA TAATTGGAGC AGGAACCTAT GCCGATAATA ATACCGTTGC TGTTTCTGCT 
ACAGGTACTG GAGAAATGTT TATTAGAACT TCAACTGCAT ACAATATTGC TGCTCAGGTG 
AAATATAAAA ATACACCATT GAAAGAAGCA GCTCAAAATG CGCTTGATGA AGTTAAAAAC 
ATTAATGGTA GTGGTGGTGT CATTGTTCTA GATAAGAATG GTAATTATAC TATGAGTTTC 
AATACAGAAG GGATGTATCG TGGAACTATC GGCAACGATG GTAAAGCTAT CGTATCAATT 
TATGAACAAT AG

Protein sequence

MNKIKGITVM AAFALCIGYA HAESQTPIRL VIHGGAGTIT KDTITPEQEK QYREKLTDAL 
NAGYAVLNSG GSSLDAVQRA INVMEDSPLF NAGKGAVFTH DGKNELDAAI MDGKTKMAGA 
VAGVTTIKNP INAAYAVMTK SPHVLMISNG AELFAKEQGL VMVEPAYFKT DFRWQQLQNA 
LKDEKITLDH NGKSASLLLP PKNYDYKYGT VGAVALDKDG NLAAGTSTGG MTNKRYGRVG 
DSPIIGAGTY ADNNTVAVSA TGTGEMFIRT STAYNIAAQV KYKNTPLKEA AQNALDEVKN 
INGSGGVIVL DKNGNYTMSF NTEGMYRGTI GNDGKAIVSI YEQ