Gene EcolC_2220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2220
Symbol
ID	6065260
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2439932
End bp	2441338
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	51%
IMG OID	641601626
Product	transcriptional regulator
Protein accession	YP_001725185
Protein GI	170020231
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.94237
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAT ACCAGCAGCT TGCAGAACAA TTACGCGAGC AGATTGCGTC GGGTATCTGG 
CAACCCGGCG ATCGTTTGCC TTCGTTGCGT GACCAGGTGG CGCTTTCAGG CATGAGCTTT 
ATGACTGTCA GCCATGCCTA TCAGTTGCTC GAAAGTCAGG GATATATTAT CGCACGACCG 
CAGTCGGGTT ATTACGTTGC GCCACAGGCA ATAAAAATGC CGAAAGCGCC AGTCATTCCA 
GTCACTCGAG ATGAAGCAGT CGATATCAAC ACTTATATTT TTGATATGTT GCAGGCCAGT 
CGCGATCCGT CGGTCGTTCC GTTTGCCTCG GCCTTTCCCG ACCCGCGACT TTTCCCCCTC 
CAACAACTAA ACCGCTCGCT GGCGCAGGTA AGCAAAACCG CCACAGCGAT GAGCGTGATT 
GAAAACTTAC CGCCAGGAAA CGCAGAACTG CGTCAGGCTA TTGCTCGTCG CTATGCCTTA 
CAGGGCATCA CCATTTCTCC TGATGAAATT GTCATTACTG CCGGGGCGTT AGAGGCATTA 
AACCTCAGTT TGCAAGCGGT AACTGAACCG GGCGATTGGG TGATAGTAGA GAATCCTTGT 
TTCTACGGTG CGTTGCAGGC GCTGGAGCGG CTACGGCTGA AGGCGTTATC GGTGGCGACG 
GATGTTAAAG AAGGGATAGA TCTTCAGGCG CTGGAACTGG CGTTGCAGGA GTATCCGGTG 
AAAGCGTGCT GGCTGATGAC TAATAGCCAG AATCCACTCG GATTTACCTT AACGCCGCAA 
AAAAAAGCAC AACTGGTGGC GTTGCTCAAT CAGTACAACG TAACGCTGAT TGAAGATGAC 
GTTTACAGCG AACTTTATTT TGGACGGGAA AAACCGCTGC CTGCGAAAGC GTGGGATCGC 
CACGATGGCG TTTTGCATTG CTCTTCGTTT TCGAAATGTC TGGTGCCTGG TTTTCGTATT 
GGTTGGGTCG CCGCCGGAAA ACATGCACGT AAAATTCAAC GCTTGCAGTT GATGAGTACG 
CTTTCCACCA GCTCACCGAT GCAACTTGCG CTGGTGGATT ACCTTTCCAC GCGCCGATAC 
GACGCCCATC TTCGTCGCCT GCGTCGCCAG CTTGCGGAAC GTAAACAACG TGCCTGGCAG 
GCACTGCTGC GTTATCTGCC TGCGGAAGTG AAAATTCATC ATAATGACAG TGGTTACTTT 
CTCTGGCTGG AGCTCCCCGA GCCGTTAGAT GCCGGCGAAT TAAGCCTGGC GGCACTGACG 
CATCATATCA GTATTGCGCC GGGTAAAATG TTTTCTACCG GTGAAAACTG GTCACGTTTT 
TTCCGTTTTA ATACCGCGTG GCAGTGGGGA GAGCGTGAAG AACAGGCGGT AAAACAATTA 
GGCAAACTTA TTCAAGAACG GCTGTAA

Protein sequence

MKKYQQLAEQ LREQIASGIW QPGDRLPSLR DQVALSGMSF MTVSHAYQLL ESQGYIIARP 
QSGYYVAPQA IKMPKAPVIP VTRDEAVDIN TYIFDMLQAS RDPSVVPFAS AFPDPRLFPL 
QQLNRSLAQV SKTATAMSVI ENLPPGNAEL RQAIARRYAL QGITISPDEI VITAGALEAL 
NLSLQAVTEP GDWVIVENPC FYGALQALER LRLKALSVAT DVKEGIDLQA LELALQEYPV 
KACWLMTNSQ NPLGFTLTPQ KKAQLVALLN QYNVTLIEDD VYSELYFGRE KPLPAKAWDR 
HDGVLHCSSF SKCLVPGFRI GWVAAGKHAR KIQRLQLMST LSTSSPMQLA LVDYLSTRRY 
DAHLRRLRRQ LAERKQRAWQ ALLRYLPAEV KIHHNDSGYF LWLELPEPLD AGELSLAALT 
HHISIAPGKM FSTGENWSRF FRFNTAWQWG EREEQAVKQL GKLIQERL