Gene EcolC_4130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4130
Symbol
ID	6066193
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4556861
End bp	4557802
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	55%
IMG OID	641603551
Product	thioesterase domain-containing protein
Protein accession	YP_001727054
Protein GI	170022100
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1246] N-acetylglutamate synthase and related acetyltransferases
TIGRFAM ID	[TIGR02447] thioesterase domain, putative

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.480913
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCACC TTCGGGTTCC ACAAACAGAA GAAGAATTAG AGCGTTACTA TCAGTTTCGC 
TGGGAAATGT TGCGTAAGCC CCTGCATCAA CCAAAAGGTT CGGAACGCGA CGCGTGGGAT 
GCGATGGCGC ATCACCAGAT GGTCGTCGAC GAGCAGGGTA ATCTGGTGGC GGTAGGCCGA 
CTGTATATTA ATGCCGACAA TGAAGCGTCC ATTCGCTTTA TGGCCGTTCA TCCCGACGTG 
CAGGACAAAG GGTTAGGCAC GCTGATGGCG ATGACCCTGG AGTCGGTGGC GCGTCAGGAA 
GGCGTTAAGC GCGTGACCTG TAGCGCCCGT GAAGACGCGG TGGAGTTTTT CGCCAAGCTG 
GGGTTTGTTA ATCAGGGAGA AATCACCACG CCAACCACCA CGCCGATTCG CCATTTTTTG 
ATGATTAAGC CCGTCGCCAC TCTGGATGAC ATTCTGCATC GCGGCGACTG GTGCGCGCAG 
CTGCAACAGG CGTGGTACGA ACATATCCCG CTTAGTGAAA AAATGGGCGT GCGCATTCAG 
CAATATACCG GGCAAAAATT TATCACTACC ATGCCAGAAA CCGGCAATCA GAATCCGCAC 
CATACGCTGT TTGCCGGGAG TTTATTCTCA CTGGCGACGC TCACCGGTTG GGGACTTATC 
TGGCTGATGC TGCGTGAACG CCACCTCGGC GGAACGATTA TTCTTGCGGA TGCGCATATC 
CGCTACAGCA AGCCGATTAG CGGTAAACCT CATGCGGTAG CCGACCTCGG TGCCTTAAGC 
GGCGATCTCG ACCGTCTGGC GCGCGGACGA AAAGCACGGG TGCAGATGCA GGTCGAAATC 
TTTGGCGACG AGACGCCGGG TGCAGTGTTT GAAGGCACGT ATATCGTTCT GCCCGCGAAG 
CCATTTGGCC CGTATGAAGA GGGCGGGAAC GAAGAAGAGT AG

Protein sequence

MYHLRVPQTE EELERYYQFR WEMLRKPLHQ PKGSERDAWD AMAHHQMVVD EQGNLVAVGR 
LYINADNEAS IRFMAVHPDV QDKGLGTLMA MTLESVARQE GVKRVTCSAR EDAVEFFAKL 
GFVNQGEITT PTTTPIRHFL MIKPVATLDD ILHRGDWCAQ LQQAWYEHIP LSEKMGVRIQ 
QYTGQKFITT MPETGNQNPH HTLFAGSLFS LATLTGWGLI WLMLRERHLG GTIILADAHI 
RYSKPISGKP HAVADLGALS GDLDRLARGR KARVQMQVEI FGDETPGAVF EGTYIVLPAK 
PFGPYEEGGN EEE