Gene EcSMS35_1444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1444
Symbol	astA
ID	6144195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1428334
End bp	1429368
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	56%
IMG OID	641616322
Product	arginine succinyltransferase
Protein accession	YP_001743502
Protein GI	170681730
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3138] Arginine/ornithine N-succinyltransferase beta subunit
TIGRFAM ID	[TIGR03243] arginine and ornithine succinyltransferase subunits [TIGR03244] arginine N-succinyltransferase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.606563
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGTCA TCCGTCCCGT TGAGCGCTCA GATGTCTCGG CGCTGATGCA GCTTGCCAGC 
AAAACGGGCG GCGGCCTGAC GTCGCTTCCC GCCAATGAAG CCACGCTTTC GGCGCGTATC 
GAAAGGGCAA TCAAAACCTG GCAAGGCGAA CTGCCCAAAA GTGAGCAGGG CTATGTGTTC 
GTGCTGGAAG ATAGTGAGAC AGGCACTGTG GCGGGGATTT GCGCCATTGA GGTGGCGGTT 
GGGCTGAACG ATCCCTGGTA CAACTATCGT GTCGGCACGC TGGTTCACGC CTCAAAAGAG 
CTGAATGTCT ATAATGCATT GCCGACGCTG TTTCTCAGTA ACGATCACAC CGGCAGCAGC 
GAGCTGTGCA CGCTGTTTCT CGACCCGGAC TGGCGCAAAG AGGGCAACGG CTATTTGCTG 
TCGAAATCGC GCTTTATGTT TATGGCGGCT TTTCGCGACA AGTTTAATGA CAAAGTGGTT 
GCTGAAATGC GCGGGGTGAT TGACGAACAT GGCTATTCAC CGTTCTGGCA AAGCCTCGGT 
AAGCGCTTCT TTTCGATGGA TTTTAGCCGC GCCGATTTTC TCTGCGGCAC CGGGCAAAAG 
GCATTTATTG CAGAACTGAT GCCGAAACAT CCGATCTATA CCCACTTTTT ATCTCAGGAA 
GCCCAGGACG TCATCGGTCA GGTACATCCG CAAACCGCGC CTGCCCGTGC GGTACTGGAG 
AAAGAAGGTT TTCGCTACCG TAATTATATC GACATCTTCG ACGGTGGGCC GACGCTTGAG 
TGTGACATCG ACCGCGTGCG CGCCATCCGT AAAAGTCGGC TGGTGGAAGT GGCAGAAGGG 
CAGCCTGCGC AGGGCGATTT TCCGGCCTGC CTGGTCGCCA ATGAAAATTA TCACCATTTC 
CGCGTGGTGC TGGTGCGTAC CGATCCGGCA ACCGAGCGTT TGATTTTAAC CGCCGCACAA 
CTGGATGCCC TCAAATGCCA CGCAGGGGAT CGCGTTCGTC TGGTGCGCCT GTGCGCAGAG 
GAGAAAACAG CATGA

Protein sequence

MMVIRPVERS DVSALMQLAS KTGGGLTSLP ANEATLSARI ERAIKTWQGE LPKSEQGYVF 
VLEDSETGTV AGICAIEVAV GLNDPWYNYR VGTLVHASKE LNVYNALPTL FLSNDHTGSS 
ELCTLFLDPD WRKEGNGYLL SKSRFMFMAA FRDKFNDKVV AEMRGVIDEH GYSPFWQSLG 
KRFFSMDFSR ADFLCGTGQK AFIAELMPKH PIYTHFLSQE AQDVIGQVHP QTAPARAVLE 
KEGFRYRNYI DIFDGGPTLE CDIDRVRAIR KSRLVEVAEG QPAQGDFPAC LVANENYHHF 
RVVLVRTDPA TERLILTAAQ LDALKCHAGD RVRLVRLCAE EKTA