Gene EcSMS35_2293 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2293
Symbol
ID	6143477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2319919
End bp	2321157
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	51%
IMG OID	641617167
Product	putative oxidoreductase
Protein accession	YP_001744340
Protein GI	170683988
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0493] NADPH-dependent glutamate synthase beta chain and related oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.00262467
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCGCAAC AAAATTATCT GGATGAACTC ACTCCGGCTT TTACGCCTTT ACTGGCGATT 
AAAGAAGCCT CTCGCTGTTT ATTATGCCAT GACGCCCCCT GTAGTCAGGC TTGTCCGGCG 
CAAACTGACC CAGGGAAATT TATCCGCTCA ATTTATTTTC GTAATTTTAA AGGTGCTGCC 
GAGACAATTC GTGAAAATAA TGCCCTCGGT GCCGTTTGTG CCAGAGTGTG CCCGACGGAG 
AAATTATGCC AAAGCGGTTG TACACGTGCT GGTGTTGATA CTCCCATTGA TATCGGTCGC 
TTACAGCGTT TTGTTACTGA TTTTGAACAA CAAACCGGGA TGGAAATTTA TCAGCCCGGT 
ACTAAAACGC TCGGCAAAGT CGCCATTATT GGCGCGGGTC CTGCCGGATT GCAGGCCAGT 
GTGACGCTGA CAAACCAGGG TTATGACGTC ACGATCTATG AGAAAGAAGC ACAACCCGGT 
GGCTGGTTGC GTAACGGCAT TCCGCAATTC CGGTTACCGC AATCGGTGCT GGATGCAGAA 
ATCGCCCGTA TAGAAAAAAT GGGCGTGACC ATTAAATGCA ATAACGAAAT CGGTAACACA 
CTCACCCTGG AGCAGCTGAA AGCGGAAAAC CGCGCGGTAC TGGTCACCGT GGGGTTATCG 
AGCGGTTCGG GGCTACCACT GTTTGAGCAT AGCGACGTTG AGATTGCCGT CGACTTCCTG 
CAACGTGCAC GACAGGCGCA AGGCGATATC AGCATTCCAC AAAGCGCATT AATTATCGGC 
GGCGGTGATG TCGCGATGGA CGTAGCCAGC ACGCTGAAAG TTCTCGGCTG TCAGGCAGTA 
ACTTGCGTAG CGCGTGAAGA GTTAGATGAG TTTCCGGCAA GCGAAAAAGA GTTTGCCAGC 
GCCCGGGAGC TGGGCGTTTC GATCATTGAT GGATTCACGC CAGTAGCCGT GGAAGGCAAT 
AAAGTCACGT TTAAGCATGT ACGGTTACCG GGCGAACTGA CGATGGCGGC AGATAAAATT 
ATTCTCGCCG TCGGTCAGCA TGCCAGACTG GATGCCTTTG CGGAGTTAGA GCCGCAGCGT 
AACACCATCA ATACACAAAA TTACCAGACC CGCGATCCGC AAGTCTTTGC TGCTGGCGAT 
ATTGTTGAGG GGGACAAAAC CGTGGTCTAT GCCGTGAAAA CCGGGAAAGA AGCCGCCGAG 
GCGATTCATC ACTATTTAGA GGGAGCTTGC TCATGTTAA

Protein sequence

MPQQNYLDEL TPAFTPLLAI KEASRCLLCH DAPCSQACPA QTDPGKFIRS IYFRNFKGAA 
ETIRENNALG AVCARVCPTE KLCQSGCTRA GVDTPIDIGR LQRFVTDFEQ QTGMEIYQPG 
TKTLGKVAII GAGPAGLQAS VTLTNQGYDV TIYEKEAQPG GWLRNGIPQF RLPQSVLDAE 
IARIEKMGVT IKCNNEIGNT LTLEQLKAEN RAVLVTVGLS SGSGLPLFEH SDVEIAVDFL 
QRARQAQGDI SIPQSALIIG GGDVAMDVAS TLKVLGCQAV TCVAREELDE FPASEKEFAS 
ARELGVSIID GFTPVAVEGN KVTFKHVRLP GELTMAADKI ILAVGQHARL DAFAELEPQR 
NTINTQNYQT RDPQVFAAGD IVEGDKTVVY AVKTGKEAAE AIHHYLEGAC SC