Gene EcHS_A3442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3442
Symbol
ID	5594583
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3444980
End bp	3446920
Gene Length	1941 bp
Protein Length	646 aa
Translation table	11
GC content	51%
IMG OID	640922560
Product	regulatory protein CsrD
Protein accession	YP_001460048
Protein GI	157162730
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00000000473717
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATTAA CGACGAAATT TTCGGCCTTT GTTACGCTGC TCACCGGGTT AACAATTTTT 
GTGACTTTGC TGGGCTGTTC GCTAAGTTTC TACAACGCCA TTCAGTATAA GTTTAGTCAT 
CGCGTTCAGG CGGTGGCGAC GGCGATTGAT ACCCACCTTG TGTCGAATGA CTTCAGCGTA 
TTAAGGCCAC AAATTACCGA ATTAATGATG TCGGCAGATA TCGTTCGTGT AGACCTGCTC 
CATGGTGATA AACAGGTTTA TACCCTGGCC AGAAATGGTA GTTATCGTCC AGTTGGCTCC 
AGCGATCTGT TTCGCGAACT GAGCGTTCCG TTGATAAAGC ATCCGGGGAT GTCGTTGCGT 
CTGGTTTATC AGGATCCGAT GGGCAACTAT TTCCATTCGT TGATGACCAC CGCGCCGCTC 
ACGGGGGCGA TTGGCTTTAT CATTGTTATG CTCTTCCTGG CGGTACGCTG GTTACAACGG 
CAACTTGCCG GGCAAGAATT GCTGGAAACC CGGGCTACTC GTATCTTAAA CGGTGAGCGT 
GGCTCTAATG TGTTGGGAAC CATCTATGAA TGGCCGCCCA GAACCAGCAG TGCGCTGGAT 
ACGCTGCTTC GTGAAATTCA GAACGCACGC GAACAACACA GCCGTCTTGA TACGCTGATC 
CGCTCTTATG CCGCCCAGGA CGTGAAAACC GGCCTCAATA ACCGACTCTT TTTCGATAAT 
CAGTTAGCAA CGTTACTGGA AGATCAGGAG AAAGTAGGTA CCCACGGGAT CGTGATGATG 
ATTCGTCTGC CGGATTTCAA TATGTTGAGC GATACCTGGG GGCACAGCCA GGTTGAAGAA 
CAGTTCTTCA CTCTGACGAA TCTGCTGTCG ACATTTATGA TGCGCTACCC TGGCGCACTG 
CTGGCGCGTT ACCACCGCAG TGATTTTGCT GCGCTGTTAC CGCACCGGAC GTTAAAAGAG 
GCAGAGAGCA TCGCCGGTCA GTTAATCAAA GCCGTTGATA CCTTGCCGAA CAATAAAATG 
CTCGATCGCG ACGATATGAT CCACATTGGT ATCTGCGCCT GGCGTAGTGG TCAGGATACC 
GAGCAGGTAA TGGAACATGC AGAGTCTGCC ACGCGTAATG CGGGATTGCA GGGCGGCAAT 
AGCTGGGCTA TTTACGATGA CTCGTTGCCT GAAAAAGGAC GCGGTAATGT TCGCTGGCGT 
ACGCTTATCG AGCAAATGCT CAGTCGCGGC GGCCCGCGCC TTTATCAAAA ACCGGCGGTT 
ACTCGCGAAG GTCAGGTTCA TCATCGCGAA CTCATGTGCC GCATCTTCGA TGGTAATGAA 
GAGGTTAGCT CGGCGGAGTA TATGCCGATG GTCTTGCAGT TTGGCTTATC GGAAGAGTAT 
GACCGTCTGC AAATCAGCCG TCTTATTCCA CTATTGCGTT ACTGGCCAGA GGAAAATCTG 
GCGATTCAGG TTACCGTTGA GTCGCTGATT CGCCCGCGTT TTCAGCGTTG GCTGCGCGAT 
ACGTTAATGC AATGTGAAAA ATCACAACGA AAACGCATAA TTATTGAACT TGCAGAGGCC 
GATGTAGGTC AACATATCAG TCGTTTACAA CCTGTTATTC GTTTAGTGAA TGCTTTAGGG 
GTACGGGTAG CCGTCAACCA GGCTGGTTTG ACGCTGGTAA GTACCAGTTG GATCAAAGAA 
CTTAATGTTG AGTTACTCAA GCTCCATCCG GGGCTGGTCA GAAACATTGA GAAGCGAACG 
GAGAACCAGC TGCTGGTTCA AAGCCTGGTG GAAGCCTGCT CCGGGACCAG CACCCAGGTT 
TACGCCACCG GCGTGCGTTC GCGAAGCGAG TGGCAGACCC TGATTCAGCG CGGTGTTACA 
GGCGGGCAAG GGGATTTTTT CGCGTCCTCA CAGCCACTTG ATACTAACGT GAAAAAATAT 
TCACAAAGAT ACTCGGTTTA A

Protein sequence

MRLTTKFSAF VTLLTGLTIF VTLLGCSLSF YNAIQYKFSH RVQAVATAID THLVSNDFSV 
LRPQITELMM SADIVRVDLL HGDKQVYTLA RNGSYRPVGS SDLFRELSVP LIKHPGMSLR 
LVYQDPMGNY FHSLMTTAPL TGAIGFIIVM LFLAVRWLQR QLAGQELLET RATRILNGER 
GSNVLGTIYE WPPRTSSALD TLLREIQNAR EQHSRLDTLI RSYAAQDVKT GLNNRLFFDN 
QLATLLEDQE KVGTHGIVMM IRLPDFNMLS DTWGHSQVEE QFFTLTNLLS TFMMRYPGAL 
LARYHRSDFA ALLPHRTLKE AESIAGQLIK AVDTLPNNKM LDRDDMIHIG ICAWRSGQDT 
EQVMEHAESA TRNAGLQGGN SWAIYDDSLP EKGRGNVRWR TLIEQMLSRG GPRLYQKPAV 
TREGQVHHRE LMCRIFDGNE EVSSAEYMPM VLQFGLSEEY DRLQISRLIP LLRYWPEENL 
AIQVTVESLI RPRFQRWLRD TLMQCEKSQR KRIIIELAEA DVGQHISRLQ PVIRLVNALG 
VRVAVNQAGL TLVSTSWIKE LNVELLKLHP GLVRNIEKRT ENQLLVQSLV EACSGTSTQV 
YATGVRSRSE WQTLIQRGVT GGQGDFFASS QPLDTNVKKY SQRYSV