Gene EcSMS35_1397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1397
Symbol
ID	6142933
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1381570
End bp	1382595
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	49%
IMG OID	641616275
Product	GAF domain/diguanylate cyclase domain-containing protein
Protein accession	YP_001743455
Protein GI	170679654
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.210623
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCAGATC AGATTATCGC CCGCGTCTCG CAATCCCTTG CCAAAGAACA GTCACTGGAA 
AGCCTGGTCC GACAGCTTCT GGAGATGCTG GAAATGGTCA CTGATATGGA ATCAACCTAC 
CTGACCAAAG TGGATGTCGA AGCGCGCCTG CAGCATATAA TGTTTGCCCG TAACAGCCAG 
AAAATGCACA TCCCGGAGAA TTTTACCGTC TCGTGGGATT ATTCGTTATG CAAACGCGCC 
ATTGATGAAA ACTGCTTTTT CAGCGATGAA GTCCCCGACC GTTGGGGCGA CTGTATTGCG 
GCACGCAATC TTGGCATCAC CACATTTCTG AGCACGCCAA TTCACTTACC GGATGGATCA 
TTCTATGGCA CGCTTTGCGC CGCCAGCAGT GAGAAGCGCC AGTGGAGTGA ACGCGCGGAA 
CAGGTTTTGC AGTTATTCGC CGGACTGATT GCACAATATA TTCAAAAAGA GGCGCTGGTA 
GAACAGCTGC GCGAAGCCAA TGCCGCACTG ATAGCGCAAT CGTATACCGA CTCGTTAACC 
GGGCTACCGA ATCGGCGGGC GATTTTTGAA AATCTGACGA CGCTGTTTTC TCTCGCCCGG 
CATCTTAACC ATAAGATAAT GATCGCGTTT ATCGACCTGG ATAACTTCAA ATTAATCAAC 
GATCGTTTTG GTCATAATAG TGGCGATCTG TTTCTCATTC AGGTTGGCGA GCGCCTTAAT 
ACGCTCCAGC AAAATGGCGA AGTTATTGGT CGTCTCGGCG GTGATGAGTT TTTGGTTGTT 
TCACTGAACA ACGAGAATAC GGATATTTCG TCGCTGCGAG AACGTATTCA ACAGCAAATA 
CGTGGAGAAT ATCACTTAGG TGATGTTGAT TTGTATTATC CCGGTGCCAG TCTTGGCATA 
GTAGAAGTCG ATCCTGAAAC GACCGATGCA GACAGTGCCC TGCATGCTGC CGATATCGCG 
ATGTATCAGG AGAAAAAACA CAAACAGAAA ACACCTTTTG TCGCGCATCC AGCGCTACAT 
TCCTGA

Protein sequence

MSDQIIARVS QSLAKEQSLE SLVRQLLEML EMVTDMESTY LTKVDVEARL QHIMFARNSQ 
KMHIPENFTV SWDYSLCKRA IDENCFFSDE VPDRWGDCIA ARNLGITTFL STPIHLPDGS 
FYGTLCAASS EKRQWSERAE QVLQLFAGLI AQYIQKEALV EQLREANAAL IAQSYTDSLT 
GLPNRRAIFE NLTTLFSLAR HLNHKIMIAF IDLDNFKLIN DRFGHNSGDL FLIQVGERLN 
TLQQNGEVIG RLGGDEFLVV SLNNENTDIS SLRERIQQQI RGEYHLGDVD LYYPGASLGI 
VEVDPETTDA DSALHAADIA MYQEKKHKQK TPFVAHPALH S