Gene EcE24377A_3357 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3357
Symbol
ID	5586099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	3374501
End bp	3376156
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	55%
IMG OID	640926988
Product	helicase/Zfx/Zfy transcription activation region domain-containing protein
Protein accession	YP_001464359
Protein GI	157156708
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTAATC GCCTGAAAAA ACTGCTTCCC GGTAACAGCA ATACCAGTAG TGCTGAGACA 
ACCGCCCCGG AAACCGCACG CCAGCCGGAA CATCTGCCGG AAGGTTTTTA TATGCCCGGG 
ACTGCAGAGG AGCTGACGTC CACACCACGC AGGAAACAGT GCCTGAAGCA GTTATGGGAA 
AACAGCAGTA TGCCATCTGA CGTGTATCAG CAGTTCTGCC TGACACCAAT ACAAAAACTC 
CTGATGGCGG CGCAGAACGT TCCCGCCGCC AGAGACTCCC GGTGGGCAGA TGCCAACGGT 
TTTGGCGACC TGACACTGCA GTTCACCACC TATGCCGTTC GTCTGGCCAG AGGATATATG 
TTTCCGCCCG GTGCCACACC GGAAGAACAG GCCGCACAGT CTGGTGTATG GAATGCCGTG 
GTGTTCTGGT CGGCACTGTT TTATCACCTG CCACTTCTTG CACACCTGGA GGGAGAACTG 
GTCAGCGGAA AGTTATGGCA GCCGGGAATG TCTTCACCGG GCGAGGCATT TCGTTTTCGC 
TACAGACAGC AACGTCTGCA GGGGGCAGAG GCTCAGCAAC TGGCAGCGGT GATGGCCGGG 
CAGCTGTTGC CGGAGGGGGC GACAGCCTGG CTGGCCACTG TGCCGGGAGC ATTACAGAAT 
CTGGCGGGGG CGGTCTGGCA TCAGCATCCG GAGATGGCAT TGATTCGTTC AGTCCTGAAA 
ACAGCGGCAG AAGAGGTGGA GAGTCCGCTC CTCGCATTAC AGGTGACGGA AGCCGTAACA 
GCACCTTTGC TCCCGGAAAA CACTGTGCAG CCTGAAGACA ATGTGCCATC TGACAGCCAG 
CCAGAAACAT CAACAGAGGT CAGTGCGCCG GAAATGTCGG CGGCCGTCCC GGAGGTAGGC 
GAATTTACGC TGCAGCCCTC TGTTTCAGGA ACCGATGAGG CCGAAGCAGT CGTCCCGGAT 
ACGTTGCAGT CTGCAACAGG CGCGGAGGAA AAGGCTCCGG AGGAGCAGAG TGTCCATGAT 
GATACCGATA TGCTGCTGAG TCTGTTTTCA GCAGTCAGTG ATGACACTGA GCCCACGGAG 
GCTGATGTGG CAGAACCTGT TGAAAATAAC GAGGCAGTTT CTGATGAATC AGGTTGTATA 
AACAGTGAAC AGGCTGGCGC GGAAAGTGAT CCTGCGCAAG ACACGGGGAT TTTTGGCTCT 
GTTTTATGTA TCAGTGAGCC GGCTCAGGAG ATAAAAAAAT CACCTGAGCA CTCACAGGGC 
CGGAACAGTA CGGAAAATGT CAGGGCTTCA GGCAGTAGTG GTGAATTTGT TGAATGGCTC 
AGACATGGAC TGGATTCGGG AGAGATCCCG GTGAATCAGC CTGATGCCAG AGTTCATCTG 
ATTGCCGGAT ATGCTTTTCT GCGTGTGCCG GATGTGTTTT ACCTGTATCT GAAACAGACG 
GGGAGTAACC ACGATCGCCG TTATGTTCAG TCCGTATTTG AGCGTGCGGG ACTTCACCGG 
GTTCGTTCCG GGGAGCGTTT TGTTCAGGCC AGGTTGTATG ATTCGGCGGA ACGAAAAGGG 
CGTTATCAAC CTGTCAGCGG TTACCTGGTG AAAAGCCGCA GTCTGTTCAG CGGAAAAGGG 
CTCCCCGGAG ACAGCCCGTT TATCACATTT CCGTGA

Protein sequence

MLNRLKKLLP GNSNTSSAET TAPETARQPE HLPEGFYMPG TAEELTSTPR RKQCLKQLWE 
NSSMPSDVYQ QFCLTPIQKL LMAAQNVPAA RDSRWADANG FGDLTLQFTT YAVRLARGYM 
FPPGATPEEQ AAQSGVWNAV VFWSALFYHL PLLAHLEGEL VSGKLWQPGM SSPGEAFRFR 
YRQQRLQGAE AQQLAAVMAG QLLPEGATAW LATVPGALQN LAGAVWHQHP EMALIRSVLK 
TAAEEVESPL LALQVTEAVT APLLPENTVQ PEDNVPSDSQ PETSTEVSAP EMSAAVPEVG 
EFTLQPSVSG TDEAEAVVPD TLQSATGAEE KAPEEQSVHD DTDMLLSLFS AVSDDTEPTE 
ADVAEPVENN EAVSDESGCI NSEQAGAESD PAQDTGIFGS VLCISEPAQE IKKSPEHSQG 
RNSTENVRAS GSSGEFVEWL RHGLDSGEIP VNQPDARVHL IAGYAFLRVP DVFYLYLKQT 
GSNHDRRYVQ SVFERAGLHR VRSGERFVQA RLYDSAERKG RYQPVSGYLV KSRSLFSGKG 
LPGDSPFITF P