Gene EcolC_2437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2437
Symbol
ID	6068490
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2688366
End bp	2689898
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	50%
IMG OID	641601846
Product	SpoVR family protein
Protein accession	YP_001725398
Protein GI	170020444
COG category	[S] Function unknown
COG ID	[COG2719] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00512702
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACGA TCGATTCTAT GAATAAGGAC ACCACACGTT TGAGCGATGG ACCCGACTGG 
ACGTTCGACC TGCTGGATGT TTATCTGGCA GAGATAGACC GGGTGGCGAA ACTCTACCGG 
CTGGATACCT ACCCGCACCA GATTGAAGTG ATAACCTCAG AACAGATGAT GGATGCCTAC 
TCCAGCGTCG GCATGCCAAT TAACTATCCG CACTGGTCAT TCGGTAAAAA GTTTATCGAG 
ACTGAACGGC TGTATAAGCA CGGTCAGCAA GGACTGGCCT ATGAAATCGT CATTAACTCT 
AACCCGTGTA TCGCTTACCT GATGGAAGAG AACACCATTA CCATGCAAGC GCTGGTGATG 
GCTCATGCCT GCTATGGGCA TAACTCTTTC TTCAAAAACA ATTACTTATT CCGTAGCTGG 
ACCGACGCCA GTTCGATTGT CGATTATCTG ATTTTTGCCC GTAAATATAT TACCGAGTGC 
GAAGAGCGTT ATGGCGTTGA TGAAGTAGAA CGGCTTCTGG ACTCGTGCCA CGCGCTGATG 
AACTACGGCG TGGACCGGTA CAAACGCCCG CAAAAAATCT CGCTGCAAGA AGAGAAAGCC 
CGGCAGAAAA GTCGCGAAGA GTATCTGCAA AGTCAGGTCA ATATGCTCTG GCGTACCCTG 
CCGAAGCGCG AGGAAGAGAA AACGGTTGCT GAAGCGCGCC GCTATCCGTC CGAACCACAA 
GAAAACCTGC TCTATTTTAT GGAGAAAAAT GCGCCACTGC TGGAATCATG GCAGCGTGAA 
ATCCTGCGTA TTGTGCGTAA GGTGAGCCAG TATTTTTATC CGCAAAAACA GACTCAGGTG 
ATGAACGAAG GCTGGGCGAC CTTCTGGCAC TACACCATCC TTAACCATCT GTATGATGAA 
GGGAAAGTAA CGGAACGTTT TATGCTGGAG TTTTTGCACA GCCACACCAA TGTGGTCTTC 
CAGCCCCCCT ATAACAGCCC GTGGTACAGC GGCATCAACC CGTATGCCCT CGGGTTCGCC 
ATGTTCCAGG ATATTAAACG GATTTGTCAG TCGCCAACGG AAGAAGACAA ATACTGGTTC 
CCGGATATCG CCGGTTCCGA CTGGCTGGAA ACGCTGCATT TCGCGATGCG TGATTTCAAA 
GATGAGAGTT TTATCAGCCA GTTCCTGTCA CCGAAAGTGA TGCGTGATTT CCGCTTCTTC 
ACCGTGCTGG ATGACGATCG GCATAATTAT CTGGAGATTT CCGCTATTCA TAATGAAGAA 
GGTTATCGGG AGATCCGTAA CCGGTTATCG TCGCAATATA ACTTAAGTAA TCTGGAGCCG 
AATATTCAGA TCTGGAACGT GGATTTGCGC GGCGACCGTT CGCTGACGCT GCGTTATATT 
CCACATAATC GCGCACCGCT GGATCGGGGG CGCAAAGAAG TCCTGAAGCA TGTGCATCGC 
CTGTGGGGAT TTGATGTGAT GCTCGAACAG CAAAACGAAG ACGGCAGCAT CGAGTTGCTG 
GAACGTTGCC CGCCAAGAAT GGGAAATCTG TAA

Protein sequence

MATIDSMNKD TTRLSDGPDW TFDLLDVYLA EIDRVAKLYR LDTYPHQIEV ITSEQMMDAY 
SSVGMPINYP HWSFGKKFIE TERLYKHGQQ GLAYEIVINS NPCIAYLMEE NTITMQALVM 
AHACYGHNSF FKNNYLFRSW TDASSIVDYL IFARKYITEC EERYGVDEVE RLLDSCHALM 
NYGVDRYKRP QKISLQEEKA RQKSREEYLQ SQVNMLWRTL PKREEEKTVA EARRYPSEPQ 
ENLLYFMEKN APLLESWQRE ILRIVRKVSQ YFYPQKQTQV MNEGWATFWH YTILNHLYDE 
GKVTERFMLE FLHSHTNVVF QPPYNSPWYS GINPYALGFA MFQDIKRICQ SPTEEDKYWF 
PDIAGSDWLE TLHFAMRDFK DESFISQFLS PKVMRDFRFF TVLDDDRHNY LEISAIHNEE 
GYREIRNRLS SQYNLSNLEP NIQIWNVDLR GDRSLTLRYI PHNRAPLDRG RKEVLKHVHR 
LWGFDVMLEQ QNEDGSIELL ERCPPRMGNL