Gene EcSMS35_1446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1446
Symbol	astB
ID	6143852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1430840
End bp	1432183
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	56%
IMG OID	641616324
Product	succinylarginine dihydrolase
Protein accession	YP_001743504
Protein GI	170681484
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3724] Succinylarginine dihydrolase
TIGRFAM ID	[TIGR03241] succinylarginine dihydrolase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.555371
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCCT GGGAAGTCAA TTTCGACGGG CTGGTAGGGC TGACGCATCA TTACGCGGGC 
CTGTCGTTTG GCAATGAAGC CTCTACCCGT CACCGTTTTC AGATCTCTAA CCCGCGGCTG 
GCGGCAAAAC AGGGCTTACT GAAAATGAAA AACCTTGCCG ATGCGGGATT CCCCCAGGCG 
GTGATCCCGC CGCACGAGCG CCCGTTTATT CCGGTGCTGC GTCAGTTGGG TTTCAGTGGT 
AGCGATGAGC AGGTACTGGA AAAGGTTGCA CGCCAGGCAC CGCACTGGCT TTCCAGCGTC 
AGCTCCGCTT CGCCAATGTG GGTAGCCAAT GCGGCAACGA TCGCGCCATC TGCCGATACG 
CTGGATGGCA AAGTGCATCT CACCATTGCT AACCTGAACA ATAAATTTCA CCGTTCGCTG 
GAAGCCCCCG TCACCGAATC GCTGTTAAAA GCGATTTTTG ACGACGAAGA GAAATTTAGC 
GTCCATTCGG CGTTGCCGCA GGTAGCCTTG CTCGGTGATG AGGGGGCGGC AAACCACAAT 
CGTCTCGGCG GTCATTACGG TGAACCGGGT ATGCAACTTT TTGTCTACGG GCGAGAAGAG 
GGCAATGATA CCCGGCCTTC CCGTTATCCG GCGCGACAGA CTCGCGAAGC CAGCGAGGCG 
GTGGCAAGGC TGAATCAGGT GAATCCCCAA CAGGTGATTT TCGCCCAGCA AAACCCGGAC 
GTTATCGACC AGGGCGTTTT TCATAATGAC GTGATTGCCG TGAGTAACCG CCAGGTGCTG 
TTTTGCCATC AACAGGCGTT CGCTCGCCAG GTGCAGTTAC TGGCAAACCT GCGTGCGCGG 
GTGAACGGTT TTATGGCGAT AGAAGTTCCG GCGACTCAGG TTTCCGTGTC AGATGCGGTG 
TCTACATATC TGTTTAACAG CCAACTGCTG AGCCGCGATG ATGGTTCCAT GATGTTGGTG 
CTGCCTCAGG AGTGTCGGGA ACACGCCGGA GTATGGGGTT ATCTCAATGA ACTCCTTGTC 
GCTGACAACC CGATTAGCGA ACTAAAAGTC TTTGATTTAC GTGAAAGCAT GGCGAATGGC 
GGAGGTCCGG CGTGCCTGCG GTTGCGCGTG GTATTGACAG AAGAAGAACG CCGGGCAGTG 
AATCCGGCGG TGATGATGAA CGATACGCTG TTTAATGCGC TCAATGACTG GGTGGATCGT 
TACTACCGCG ATCGCCTTAC TGCTGCCGAT CTGGCCGACC CGCAATTGCT GCGCGAAGGG 
CGGGAAGCAC TGGATGTATT GAGCCAATTA CTGAATCTCG GTTCGGTTTA TCCGTTCCAG 
CGCGAGGGAG GGGGCAATGG ATAA

Protein sequence

MNAWEVNFDG LVGLTHHYAG LSFGNEASTR HRFQISNPRL AAKQGLLKMK NLADAGFPQA 
VIPPHERPFI PVLRQLGFSG SDEQVLEKVA RQAPHWLSSV SSASPMWVAN AATIAPSADT 
LDGKVHLTIA NLNNKFHRSL EAPVTESLLK AIFDDEEKFS VHSALPQVAL LGDEGAANHN 
RLGGHYGEPG MQLFVYGREE GNDTRPSRYP ARQTREASEA VARLNQVNPQ QVIFAQQNPD 
VIDQGVFHND VIAVSNRQVL FCHQQAFARQ VQLLANLRAR VNGFMAIEVP ATQVSVSDAV 
STYLFNSQLL SRDDGSMMLV LPQECREHAG VWGYLNELLV ADNPISELKV FDLRESMANG 
GGPACLRLRV VLTEEERRAV NPAVMMNDTL FNALNDWVDR YYRDRLTAAD LADPQLLREG 
REALDVLSQL LNLGSVYPFQ REGGGNG