Gene EcolC_1888 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1888
Symbol
ID	6065027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2089767
End bp	2090735
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	54%
IMG OID	641601301
Product	succinylglutamate desuccinylase
Protein accession	YP_001724863
Protein GI	170019909
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2988] Succinylglutamate desuccinylase
TIGRFAM ID	[TIGR03242] succinylglutamate desuccinylase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0217529
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAATT TCCTTGCTCT GACCTTAACG GGTAAAAAAC CGGTTATCAC CGAGCGAGAA 
ATCAACGGCG TTCGCTGGCG CTGGCTGGGC GATGGTGTGC TGGAACTGAC GCCATTAACG 
CCACCGCAAG GCGCACTGGT GATTTCTGCG GGGATCCACG GTAATGAGAC GGCACCTGTG 
GAGATGCTGG ACGCGTTGCT TGGCGCGATA TCTCACGGCG AGATCCCGTT ACGTTGGCGG 
TTGCTGGTGA TCCTCGGGAA TCCTCCTGCG CTGAAGCAAG GGAAACGTTA TTGCCATAGC 
GATATGAACC GAATGTTTGG CGGTCGTTGG CAGCTGTTTG CTGAAAGCGG GGAAACCTGT 
CGGGCGCGCG AACTGGAACA GTGCCTGGAA GATTTTTATG ACCAGGGTAA AGAATCTGTG 
CGCTGGCACC TTGATCTACA TACAGCAATT CGTGGCTCCT TGCATCCGCA GTTCGGTGTA 
TTACCGCAAC GCGACATACC CTGGGACGAG AAATTCCTGA CGTGGCTGGG TGCGGCGGGG 
CTGGAGGCAC TGGTGTTCCA TCAGGAGCCT GGTGGTACGT TTACCCATTT CAGCGCCAGA 
CATTTTGGCG CGCTGGCCTG TACGCTGGAA CTCGGCAAAG CGTTGCCCTT TGGACAAAAC 
GATCTTCGCC AGTTTGCAGT AACTGCCAGC GCAATTGCTG CGCTGCTATC TGGTGAGAGT 
GTTGGTATCG TGAGAACGCC GCCGCTCCGT TATCGGGTGG TTTCGCAAAT TACTCGCCAC 
TCGCCGTCCT TCGAAATGCA TATGGCAAGT GACACGCTGA ATTTTATGCC GTTTAAGAAA 
GGAACGTTGC TGGCGCAGGA CGGTGAGGAA CGTTTTACCG TAACCCATGA TGTAGAGTAT 
GTGTTATTCC CTAATCCGTT GGTAGCGTTG GGATTACGCG CGGGATTAAT GCTCGAAAAA 
ATAAGCTAA

Protein sequence

MDNFLALTLT GKKPVITERE INGVRWRWLG DGVLELTPLT PPQGALVISA GIHGNETAPV 
EMLDALLGAI SHGEIPLRWR LLVILGNPPA LKQGKRYCHS DMNRMFGGRW QLFAESGETC 
RARELEQCLE DFYDQGKESV RWHLDLHTAI RGSLHPQFGV LPQRDIPWDE KFLTWLGAAG 
LEALVFHQEP GGTFTHFSAR HFGALACTLE LGKALPFGQN DLRQFAVTAS AIAALLSGES 
VGIVRTPPLR YRVVSQITRH SPSFEMHMAS DTLNFMPFKK GTLLAQDGEE RFTVTHDVEY 
VLFPNPLVAL GLRAGLMLEK IS