Gene EcolC_1639 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1639
Symbol
ID	6065580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1819885
End bp	1820862
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	44%
IMG OID	641601053
Product	DeoR family transcriptional regulator
Protein accession	YP_001724623
Protein GI	170019669
COG category	[K] Transcription
COG ID	[COG2390] Transcriptional regulator, contains sigma factor-related N-terminal domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.294849
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00400864
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAAAAGA GAATGACGAA ACAGAAAAAA AACAGCCGCT GGCAGGGTTA CGATCCTCGC 
TACATATACT CGCTCGTGGT CAGACGTTAT TTTGCGGATA TGAAAACCAA GATTGAGATT 
GCAGAGGAGC TTGGCGTTTC CCGCTTTAAA GTTGCCAGAT TGATCGATGA GGCGATCGAA 
CAGGAATACG TGAGGTTTAT CTTCCCTAAG CAGCAAGCGA TGGATGAAGA AATCGCTAAT 
AATCTACGGA AAAAATTTCA TCTGGAAGAT GCAATTGTTC TTTCAGTTGC TGAATCCTGG 
ACGACGCAAG AAGAACTCAA TCACAAATTG GGTGAAGTCA CCGCTGAATA TCTTATGCAA 
TCTCTTCATG AAGATATGAA AGTGGGGATC GCCTGGGGAC GTGTATTATC AAGCACGGTC 
AGTAAGTTGA GCAAGTTGCC TCCTTTAGAC GTTGTGCAGT TATCTGGCGT ACATCCGGGG 
ATCGAGTTTA GTCAGGGGCC AATAGATCTT ATTCATAAGA TCGCTGCCAT TTCGCAGGGA 
AAAGCGCACC CAATGTACGT GCCGATGTGG GTCGATGACG AAGAGCTTGC TGCCAGACTG 
GCAGGTGATC CTGCGGTATT AGATACACAG CAATATTACT CACAGTTGGA TGTGGTTATC 
ACCGGGATAG GTGACTGGAA ATCAGGTTCT TCAAGCTTGT GTAAAATATT TCCGGATACC 
TGGTGCGAAG CTTTGTTTCA ACAAGATATC GCTGCGGATG TGTGTATCTC GTTGGTCAGC 
AGGGAAGGGA AGATTCTTCA TAGTCCTATT GAACGTCTGG GATTTGGCAT TTCGACGGAT 
CAACTACAAA AAGCCAAAAA AGTGATTGGT GTCGCTGGAG GAGAAGAAAA ATATGAAGGC 
ATTCTTGCTT CGCTGAAATC TGGACTTTTA AATGTCTTAA TTACTGATTT TGATACGGCC 
ATTAAACTTC TGGATTAA

Protein sequence

MEKRMTKQKK NSRWQGYDPR YIYSLVVRRY FADMKTKIEI AEELGVSRFK VARLIDEAIE 
QEYVRFIFPK QQAMDEEIAN NLRKKFHLED AIVLSVAESW TTQEELNHKL GEVTAEYLMQ 
SLHEDMKVGI AWGRVLSSTV SKLSKLPPLD VVQLSGVHPG IEFSQGPIDL IHKIAAISQG 
KAHPMYVPMW VDDEELAARL AGDPAVLDTQ QYYSQLDVVI TGIGDWKSGS SSLCKIFPDT 
WCEALFQQDI AADVCISLVS REGKILHSPI ERLGFGISTD QLQKAKKVIG VAGGEEKYEG 
ILASLKSGLL NVLITDFDTA IKLLD