Gene EcolC_2583 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2583
Symbol
ID	6065458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2835778
End bp	2836869
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	55%
IMG OID	641601990
Product	luciferase family protein
Protein accession	YP_001725541
Protein GI	170020587
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03612] pyrimidine utilization protein A

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.126668
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTG GCGTATTCGT ACCTATTGGC AACAACGGCT GGCTCATTTC GACCCACGCG 
CCGCAGTACA TGCCGACCTT TGAACTGAAT AAAGCCATCG TGCAAAAAGC GGAGCACTAC 
CATTTCGATT TCGCCCTGTC GATGATCAAA CTGCGTGGCT TTGGCGGCAA AACTGAGTTC 
TGGGATCACA ACCTTGAGTC GTTCACCTTG ATGGCGGGGC TGGCGGCCGT GACCTCGCGC 
ATTCAGATTT ACGCCACCGC CGCCACCTTA ACGTTACCTC CAGCAATCGT CGCCCGTATG 
GCCGCAACCA TCGACTCAAT CTCTGGCGGG CGTTTTGGCG TCAACCTCGT GACTGGCTGG 
CAAAAGCCCG AGTATGAGCA GATGGGTATC TGGCCTGGCG ATGACTATTT CTCCCGTCGT 
TACGACTATC TCACCGAGTA TGTTCAGGTG CTGCGCGACC TGTGGGGCAC GGGAAAAAGC 
GATTTTAAAG GCGATTTTTT CACCATGAAT GATTGTCGCG TCAGTCCGCA ACCGAGTGTC 
CCTATGAAAG TGATCTGCGC CGGGCAAAGC GACGCTGGCA TGGCGTTCTC CGCCCAGTAT 
GCCGATTTCA ACTTCTGTTT CGGCAAAGGC GTAAATACAC CCACGGCTTT CGCCCCGACC 
GCTGCGCGGA TGAAACAGGC CGCAGAGCAA ACCGGGCGCG ACGTTGGCTC TTATGTATTG 
TTTATGGTGA TTGCCGATGA AACCGACGAT GCCGCTCGCG CCAAATGGGA ACACTACAAA 
GCGGGCGCGG ATGAAGAGGC GTTAAGCTGG CTAACCGAAC AAAGTCAGAA AGATACCCGC 
TCAGGTACTG ACACCAACGT CCGTCAGATG GCCGATCCCA CTTCGGCGGT AAACATCAAT 
ATGGGGACGT TAGTCGGTTC TTACGCCAGT GTCGCGCGCA TGTTAGATGA AGTCGCAAGC 
GTGCCTGGTG CCGAAGGCGT GCTGTTAACC TTCGACGATT TTCTGTCGGG AATCGAAACC 
TTCGGCGAGC GCATTCAACC ACTGATGCAG TGCCGCGCCC ATCTCCCTGT GCTGACTCAG 
GAGGTGGCAT GA

Protein sequence

MKIGVFVPIG NNGWLISTHA PQYMPTFELN KAIVQKAEHY HFDFALSMIK LRGFGGKTEF 
WDHNLESFTL MAGLAAVTSR IQIYATAATL TLPPAIVARM AATIDSISGG RFGVNLVTGW 
QKPEYEQMGI WPGDDYFSRR YDYLTEYVQV LRDLWGTGKS DFKGDFFTMN DCRVSPQPSV 
PMKVICAGQS DAGMAFSAQY ADFNFCFGKG VNTPTAFAPT AARMKQAAEQ TGRDVGSYVL 
FMVIADETDD AARAKWEHYK AGADEEALSW LTEQSQKDTR SGTDTNVRQM ADPTSAVNIN 
MGTLVGSYAS VARMLDEVAS VPGAEGVLLT FDDFLSGIET FGERIQPLMQ CRAHLPVLTQ 
EVA