Gene EcSMS35_1406 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1406
Symbol
ID	6142786
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1388450
End bp	1389784
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	39%
IMG OID	641616284
Product	diguanylate cyclase
Protein accession	YP_001743464
Protein GI	170680353
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTACAC AAAAATTAAA AGCTCAAGGC TTTTTTGTTT TCAGCTTATT GCTGACGTTA 
ATTTTATTTT GCATTACTAC TTTATATAAC GAAAACACGA ATGTAAAACT CATCCCACAG 
ATGAATTACC TGATGGTTGT TGTGGCTTTG TTTTTCCTTA ACGCCGTCAT TTTTCTTTTC 
ATGTTAATGA AGTATTTCAC TAACAAACAA ATTTTACCAA CACTCATTTT AAGCCTTGCA 
TTTTTAAGTG GCCTTATCTA TTTAGTTGAA ACCATTGTAA TTATCCATAA ACCAATCAAC 
GGCAGTACAC TGATCCAGAC AAAGTCGAAT GATGTTTCTA TTTTCTATAT TTTCCGCCAA 
CTCAGTTTCA TTTGTTTAAC CTCGCTGGCG CTCTTTTGTT ATGGGAAAGA CAACATCCTT 
GACAACAATA AGAAAAAAAC TGGCATTCTG TTGCTGGCGC TGATTCCTTT TTTAGTTTTT 
CCCCTTCTGG CACACAATCT GAGTAGTTAT AACGCTGACT ATTCTTTGTA TGTCGTCGAT 
TACTGTCCGG ACAACCATAC TGCGACCTGG GGAATCAACT ATACAAAAAT ATTGGTTTGT 
TTGTGGGCAT TTTTACTGTT CTTTATTATC ATGCGTACAC GATTAGCCAG CGAACTATGG 
CCGTTAATAG CATTATTATG TCTGGCATCG CTATGCTGCA ACTTACTTCT ACTGACTCTG 
GATGAGTATA ATTACACCAT CTGGTATATC AGTCGCGGGA TTGAAGTTTC CAGTAAACTG 
TTTGTTGTGT CTTTTCTGAT TTATAACATT TTTCAGGAAC TGCAACTCTC CAGCAAACTG 
GCAGTTCATG ATGTGCTGAC CAATATTTAT AATCGGCGCT ACTTTTTCAA CAGCGTAGAG 
TCATTATTGT CGCGACCTGT TGTTAAGGAC TTTTGTGTCA TGCTGGTTGA TATTAATCAG 
TTCAAACGCA TCAATGCCCA ATGGGGACAT CGTGTGGGTG ATAAAGTGCT GGTATCAATT 
GTCGATATTA TCCAGCAAAG CATCCGCCCC GATGATATTT TAGCGCGACT GGAGGGTGAG 
GTGTTTGGCT TGCTATTTAC CGAACTCAAT AGTGCCCAGG CAAAAATCAT TGCGGAACGT 
ATGCGTAAAA ATGTCGAACT CCTGACCGGC TTTAGTAACA GATATGATGT TCCTGAACAA 
ATGACCATCA GTATTGGCAC GGTTTTTTCA ACGGGTGACA CGCATAATAT CTCGCTTGTC 
ATGACGGAAG CAGATAAAGC CTTACGCGAA GCGAAAAGCG AGGGGGGCAA CAAAGTGATT 
ATTCATCATA TTTAA

Protein sequence

MGTQKLKAQG FFVFSLLLTL ILFCITTLYN ENTNVKLIPQ MNYLMVVVAL FFLNAVIFLF 
MLMKYFTNKQ ILPTLILSLA FLSGLIYLVE TIVIIHKPIN GSTLIQTKSN DVSIFYIFRQ 
LSFICLTSLA LFCYGKDNIL DNNKKKTGIL LLALIPFLVF PLLAHNLSSY NADYSLYVVD 
YCPDNHTATW GINYTKILVC LWAFLLFFII MRTRLASELW PLIALLCLAS LCCNLLLLTL 
DEYNYTIWYI SRGIEVSSKL FVVSFLIYNI FQELQLSSKL AVHDVLTNIY NRRYFFNSVE 
SLLSRPVVKD FCVMLVDINQ FKRINAQWGH RVGDKVLVSI VDIIQQSIRP DDILARLEGE 
VFGLLFTELN SAQAKIIAER MRKNVELLTG FSNRYDVPEQ MTISIGTVFS TGDTHNISLV 
MTEADKALRE AKSEGGNKVI IHHI