Gene EcolC_0839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0839
Symbol
ID	6067240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	906957
End bp	908735
Gene Length	1779 bp
Protein Length	592 aa
Translation table	11
GC content	46%
IMG OID	641600244
Product	PAS modulated sigma54 specific transcriptional regulator
Protein accession	YP_001723838
Protein GI	170018884
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3829] Transcriptional regulator containing PAS, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCTTG CTACTACGCA GTCAGTATTG ATGCAAATTC AACCGACAAT TCAGCGTTTT 
GCCAGAATGC TTGCCAGCGT TTTGCAGCTT GAGGTTGAGA TCGTTGATGA AAACTTGTGT 
CGCGTTGCCG GAACGGGCGC GTATGGGAAG TTTCTTGGTC GCCAGTTGAG CGGCAACTCA 
CGCCTGCTCC GCCACGTCCT GGAAACGAAA ACTGAAAAAG TTGTGACACA GTCTCGCTTC 
GATCCCCTTT GCGAAGGTTG CGATAGTAAA GAAAATTGCC GCGAAAAAGC ATTTCTGGGT 
ACGCCTGTCA TTTTACAGGA TCGTTGTGTT GGGGTGATAA GTTTGATTGC CGTTACCCAC 
GAGCAACAAG AGCATATCAG TGATAATTTA CGCGAATTTT CTGATTATGT TCGCCATATA 
TCCACCATTT TTGTTTCGAA ACTTCTGGAG GATCAGGGGC CAGGAGATAA CATCAGTAAA 
ATATTCGCGA CCATGATCGA TAATATGGAT CAGGGCGTAT TAGTTGTTGA TGATGAAAGT 
CGGGTTCAGT TTGTTAATCA GACTGCCTTA AAAACACTTG GTGTTGTACA AAATAATATT 
ATTGGGAAAC CTATCCGTTT CAGACCATTA ACATTTGAGA GTAATTTTAC TCATGGACAT 
ATGCAGCATA TTGTTTCGTG GGACGATAAA AGTGAATTAA TCATTGGTCA ATTGCATAAC 
ATTCAGGGCC GACAATTATT TTTAATGGCA TTTCACCAAT CGCATACCAG TTTTTCTGTA 
GCAAATGCAC CTGATGAACC ACATATTGAA CAATTGGTTG GCGAGTGCCG TGTTATGCGG 
CAATTAAAAC GACTCATTAG CCGTATTGCA CCCAGCCCAT CCAGCGTTAT GGTGGTTGGT 
GAAAGCGGCA CGGGTAAAGA AGTCGTCGCC CGAGCAATCC ATAAGTTGAG CGGAAGACGG 
AATAAACCCT TTATTGCTAT CAACTGTGCC GCGATTCCGG AGCAGCTTCT GGAAAGCGAA 
CTGTTCGGTT ATGTTAAAGG CGCATTTACT GGCGCTTCTG CCAACGGTAA AACAGGGTTG 
ATTCAGGCGG CGAATACGGG CACGCTGTTT CTCGATGAAA TAGGTGATAT GCCATTAATG 
TTGCAGGCTA AATTACTGCG CGCTATTGAG GCGCGTGAAA TTCTGCCGAT TGGTGCCAGT 
AGCCCAATAC AAGTCGACAT TCGCATCATT TCTGCAACTA ATCAGAATTT GGCCCAGTTC 
ATTGCCGAAG GTAAATTCCG CGAAGATCTC TTCTACCGAC TTAATGTTAT CCCGATAACT 
CTGCCACCGC TGCGTGAACG TCAGGAAGAT ATTGAACTAT TGGTGCATTA CTTTTTACAT 
CTGCATACCC GTCGTCTGGG ATCGGTTTAT CCTGGCATTG CTCCCGATGT CGTCGAAATA 
TTGCGTAAGC ATCGTTGGCC CGGAAACCTG CGCGAGTTAA GCAATTTGAT GGAATATCTG 
GTTAACGTGG TTCCTTCAGG TGAAGTTATC GACAGCACGC TATTGCCGCC AAATCTGCTG 
AATAATGGCA CAACGGAGCA AAGTGATGTA ACAGAGGTCA GTGAGGCGCA CCTGTCACTC 
GATGATGCGG GCGGCACGGC GCTGGAGGAG ATGGAAAAGC AAATGATCCG CGAGGCGCTT 
TCACGTCATA ACAGCAAGAA GCAAGTTGCT GATGAACTGG GCATCGGCAT TGCTACGCTC 
TATCGCAAGA TTAAGAAATA TGAGTTGTTA AACACATAA

Protein sequence

MELATTQSVL MQIQPTIQRF ARMLASVLQL EVEIVDENLC RVAGTGAYGK FLGRQLSGNS 
RLLRHVLETK TEKVVTQSRF DPLCEGCDSK ENCREKAFLG TPVILQDRCV GVISLIAVTH 
EQQEHISDNL REFSDYVRHI STIFVSKLLE DQGPGDNISK IFATMIDNMD QGVLVVDDES 
RVQFVNQTAL KTLGVVQNNI IGKPIRFRPL TFESNFTHGH MQHIVSWDDK SELIIGQLHN 
IQGRQLFLMA FHQSHTSFSV ANAPDEPHIE QLVGECRVMR QLKRLISRIA PSPSSVMVVG 
ESGTGKEVVA RAIHKLSGRR NKPFIAINCA AIPEQLLESE LFGYVKGAFT GASANGKTGL 
IQAANTGTLF LDEIGDMPLM LQAKLLRAIE AREILPIGAS SPIQVDIRII SATNQNLAQF 
IAEGKFREDL FYRLNVIPIT LPPLRERQED IELLVHYFLH LHTRRLGSVY PGIAPDVVEI 
LRKHRWPGNL RELSNLMEYL VNVVPSGEVI DSTLLPPNLL NNGTTEQSDV TEVSEAHLSL 
DDAGGTALEE MEKQMIREAL SRHNSKKQVA DELGIGIATL YRKIKKYELL NT