Gene EcolC_1887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1887
Symbol
ID	6065089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2088431
End bp	2089774
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	56%
IMG OID	641601300
Product	succinylarginine dihydrolase
Protein accession	YP_001724862
Protein GI	170019908
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3724] Succinylarginine dihydrolase
TIGRFAM ID	[TIGR03241] succinylarginine dihydrolase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0206768
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCCT GGGAAGTTAA TTTCGACGGG CTGGTAGGGC TGACGCATCA TTACGCGGGC 
CTGTCGTTTG GTAATGAAGC CTCTACCCGT CACCGTTTTC AGGTGTCTAA CCCGCGACTG 
GCGGCGAAGC AGGGCTTACT GAAAATGAAA GCCCTTGCCG ATGCGGGATT CCCCCAGGCC 
GTGATCCCGC CGCACGAGCG TCCGTTTATT CCGGTGCTGC GTCAGTTGGG ATTCAGCGGT 
AGCGATGAGC AGGTACTGGA AAAAGTTGCA CGCCAGGCAC CGCACTGGCT TTCCAGCGTC 
AGCTCCGCTT CGCCAATGTG GGTAGCCAAT GCGGCAACGA TCGCGCCATC TGCCGATACG 
CTGGATGGCA AAGTGCATCT CACCGTTGCC AACCTGAACA ATAAATTTCA CCGTTCGCTG 
GAAGCGCCCG TCACTGAATC GCTGTTAAAA GCTATTTTTA ACGACGAAGA GAAATTTAGC 
GTCCATTCGG CGTTGCCGCA GGTAGCGTTG CTCGGTGATG AGGGGGCGGC AAACCACAAT 
CGTCTCGGCG GTCATTACGG TGAGCCGGGT ATGCAACTTT TTGTCTACGG GCGAGAAGAA 
GGCAATGATA CCCTGCCTTC CCGTTATCCG GCGCGACAGA CTCGCGAAGC CAGCGAGGCG 
GTGGCAAGGC TGAATCAGGT GAATCCCCAA CAGGTGATTT TCGCCCAGCA AAACCCGGAC 
GTTATCGACC AGGGCGTTTT TCATAATGAC GTGATTGCCG TGAGTAACCG CCAGGTGCTG 
TTTTGCCACC AACAGGCGTT CGCTCGCCAG TCACAGTTAC TGGCAAACCT GCGTGCGCGG 
GTCAATGGTT TTATGGCGAT AGAAGTTCCG GCAACTCAGG TTTCCGTGTC GGATGCGGTG 
TCTACATATC TGTTCAACAG CCAACTGCTG AGCCGCGATG ATGGTTCCAT GGTGTTGGTG 
CTGCCACAGG AGTGTCGGGA ACACGCCGGA GTATGGTGTT ATCTCAATGA ACTCCTTGCC 
GCTGACAACC CGATCAGCGA ACTAAAAGTC TTTGATTTAC GTGAAAGCAT GGCGAATGGC 
GGCGGCCCGG CGTGCCTGCG GTTGCGGGTG GTATTGACAC AAGAAGAACG CCGGGCGGTG 
AATCCGGCGG TGATGATGAA CGATACCTTG TTTAATGCGC TCAATGACTG GGTGGATCGT 
TACTACCGCG ATCGTCTTAC TGCTGCCGAT CTGGCCGACC CGCAATTGCT GCGCGAAGGG 
CGGGAAGCAC TGGATGTATT GAGCCAATTA CTGAATCTCG GTTCGGTTTA TCCGTTCCAG 
CGCGAGGGAG GGGGCAATGG ATAA

Protein sequence

MNAWEVNFDG LVGLTHHYAG LSFGNEASTR HRFQVSNPRL AAKQGLLKMK ALADAGFPQA 
VIPPHERPFI PVLRQLGFSG SDEQVLEKVA RQAPHWLSSV SSASPMWVAN AATIAPSADT 
LDGKVHLTVA NLNNKFHRSL EAPVTESLLK AIFNDEEKFS VHSALPQVAL LGDEGAANHN 
RLGGHYGEPG MQLFVYGREE GNDTLPSRYP ARQTREASEA VARLNQVNPQ QVIFAQQNPD 
VIDQGVFHND VIAVSNRQVL FCHQQAFARQ SQLLANLRAR VNGFMAIEVP ATQVSVSDAV 
STYLFNSQLL SRDDGSMVLV LPQECREHAG VWCYLNELLA ADNPISELKV FDLRESMANG 
GGPACLRLRV VLTQEERRAV NPAVMMNDTL FNALNDWVDR YYRDRLTAAD LADPQLLREG 
REALDVLSQL LNLGSVYPFQ REGGGNG