Gene EcHS_A4532 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4532
Symbol
ID	5594340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4538288
End bp	4540363
Gene Length	2076 bp
Protein Length	691 aa
Translation table	11
GC content	46%
IMG OID	640923628
Product	ATPase
Protein accession	YP_001461068
Protein GI	157163750
COG category	[V] Defense mechanisms
COG ID	[COG1401] GTPase subunit of restriction endonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	0.228072
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCTTG TAGATAGTGT CGAAGCAGGT AGGCTAACGA TTAGTGAATT GATTGATGCC 
CTGGCGAAAG ATAAAAATTA CACAGCTTCC AGATGGTATC AGCGATACCG TGCATTTACG 
ACTTTGCTAC AGCAAACCTC AACTTTTGCT GAGCCTGCAA CAGATGGTCT GGTCAAACAG 
CTTTGGTATG AGCGTGACAA CGGCATTGCA AGTATTCGCC AGGGCGTTCC ATCCTTAGCA 
GAATATCAGC AAAGCCTGCC ACTGCTTAGA GAACTAACTG AACGAATTCG GCAACAGCCG 
GATGAAGAAA CTTACCAATA TGTTGGCAAT GCACTTCAAC AAGCTAAAGA AAACGGACTT 
CTCAAGCGTA TGTATTGGAG TTTGAGAAAT CGCGTCTTTG CCGCGTTCTC GCCAGAAAAC 
TACACCAGTA CTGTGGATGA GAATGCTTTT AATAAAGCAG CAGAATTCTT AAATCAGCAC 
TTCCATCTCG GTTTGGTACT GACCGGAAAT TGGTTACAGA AAAACTATGA ATTGAAACAA 
GCCATACACG CCCAATCTCC TGATACAGAT CCTTATTATG TGAATATGGC CATCTGGCAT 
CTCTATGAAT TGCTCCGTGA ACGCGATAAT GAACAAAAGC AGGAGAAAGT AGCTAGCACT 
ACATCCATAA CCCGCAGTGA GCCCATCGAG AACAAGATCA TCCTACATTC ACCAACTAAC 
GTGATCTTCT TTGGCCCCCC TGGCACTGGC AAGACCTTCA GGTTGCAGCA AAAAATGAAA 
GAGTACACTT CTCATGCTGT TCCCGCTGAT CGTGATGCCT GGCTGGATTC TCGCCTTGAA 
TCGTTGAACT GGATGCAGGT TATAACGCTG GTGCTGCTCG ATCTTGGGAA ACGAGCGAAA 
GTTCGCCAAA TTATTGAACA TATGTGGTTT CAACGTAAGG CATTATTAAA CGGTCGTAAT 
GGCAATCTAT CGAATACTGC CTGGGCAGCT TTGCAATCCT ATACAGTTCC CGAGTCGTTA 
ACCGTTGATT ATAAGAATCG GCGTGAGCCT GCCGTATTTA ACAAAACAGA TAACAGCGAA 
TGGTTTCTAG TTGATTCACA GCTCGAGCAA GTGGAGGATT TGGTAGAGCT CTACGCCGAA 
CTTAAACGTG GCCCTAAATC TGCCGAAGCC ATCCAGCGTT TTGCGGTGGT TACGTTCCAC 
CAATCTTACG GCTATGAAGA ATTTATTGAA GGTATACGCG CTCGCTCTGA CGAGAGTGGC 
AATATCTCTT ATCCCATTGA GCCGGGTATC TTTATGCGCC TTTGCCAACG TGCGAATGCC 
GATCCAGGAC ATCGCTACGC CATTTTCATT GATGAGATCA ATCGCGGTAA CATATCCAAG 
ATCTTTGGTG AACTAATCTC ACTCATTGAA GTAGACAAGC GTGCAGGCAT GCCCAATGCG 
ATGAGCCTGC AACTGGCTTA TAGCGGTGAT CACTTCAGCG TACCCGGCAA TGTCGATATC 
ATCGGAGCCA TGAATACAGC GGACCGTTCT TTAGCTCTGA TGGACACGGC TTTGCGCCGT 
CGCTTTGACT TTGTCGAAAT GATGCCTGAT CTCTCTTTAC TGAGTGAAGC TAAGGTGAAA 
GGCATAGAGC TCGAGTCGTT GTTAGAGAAA CTCAATAGCC GCATCGAGGC TCTTTACGAT 
CGTGAACATA CGCTGGGGCA TGCGTTCTTT ATGCCGGTAA AAAATGCACT CGATGCCGGT 
GATGAAGAAG CTGCGTTTAA ACAATTGAAG ATCGCATTCC AGAAAAAGAT CATTCCGCTT 
TTACAGGAAT ACTTTTTCGA TGACTGGAAC AAGATCCGGT TGGTGCTGGC AGACAATCAA 
AAGCAAGACG ACAACCTGCA ATTCGTGATT GAGAAAACCG ACGATCTCGA TACGCTTTTT 
GGTAACAACC ATGGTTTACG ACGCCATGAT CAGCAATCAA CAGCTTATGA GCTCAAAGAT 
TTCGATCAAG AGATCTGGAA TATTCCACAG GCTTATCGTT CAATTTATCA GCCCCAACAG 
ACTCCCCTTG ATGAGCAGGC AGTAAATCAT GGGTGA

Protein sequence

MTLVDSVEAG RLTISELIDA LAKDKNYTAS RWYQRYRAFT TLLQQTSTFA EPATDGLVKQ 
LWYERDNGIA SIRQGVPSLA EYQQSLPLLR ELTERIRQQP DEETYQYVGN ALQQAKENGL 
LKRMYWSLRN RVFAAFSPEN YTSTVDENAF NKAAEFLNQH FHLGLVLTGN WLQKNYELKQ 
AIHAQSPDTD PYYVNMAIWH LYELLRERDN EQKQEKVAST TSITRSEPIE NKIILHSPTN 
VIFFGPPGTG KTFRLQQKMK EYTSHAVPAD RDAWLDSRLE SLNWMQVITL VLLDLGKRAK 
VRQIIEHMWF QRKALLNGRN GNLSNTAWAA LQSYTVPESL TVDYKNRREP AVFNKTDNSE 
WFLVDSQLEQ VEDLVELYAE LKRGPKSAEA IQRFAVVTFH QSYGYEEFIE GIRARSDESG 
NISYPIEPGI FMRLCQRANA DPGHRYAIFI DEINRGNISK IFGELISLIE VDKRAGMPNA 
MSLQLAYSGD HFSVPGNVDI IGAMNTADRS LALMDTALRR RFDFVEMMPD LSLLSEAKVK 
GIELESLLEK LNSRIEALYD REHTLGHAFF MPVKNALDAG DEEAAFKQLK IAFQKKIIPL 
LQEYFFDDWN KIRLVLADNQ KQDDNLQFVI EKTDDLDTLF GNNHGLRRHD QQSTAYELKD 
FDQEIWNIPQ AYRSIYQPQQ TPLDEQAVNH G