Gene EcolC_4225 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4225
Symbol
ID	6067822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4667286
End bp	4669307
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	54%
IMG OID	641603657
Product	ATP-dependent DNA helicase Rep
Protein accession	YP_001727149
Protein GI	170022195
COG category	[L] Replication, recombination and repair
COG ID	[COG0210] Superfamily I DNA and RNA helicases
TIGRFAM ID	[TIGR01074] ATP-dependent DNA helicase Rep

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCTAA ACCCCGGCCA ACAACAAGCT GTCGAATTCG TTACCGGCCC CTGCCTGGTG 
CTGGCGGGCG CGGGTTCCGG TAAAACTCGT GTTATCACCA ATAAAATCGC CCATCTGATC 
CGCGGTTGCG GTTATCAGGC GCGGCACATT GCGGCGGTGA CCTTTACTAA TAAAGCAGCG 
CGCGAGATGA AAGAGCGTGT AGGGCAGACG CTGGGGCGCA AAGAGGCGCG TGGGCTGATG 
ATCTCCACTT TCCATACGTT GGGGCTGGAT ATCATCAAAC GCGAGTATGC GGCGCTTGGG 
ATGAAAGCGA ACTTCTCGTT GTTTGACGAT ACCGATCAGC TTGCTTTGCT TAAAGAGTTG 
ACCGAGGGGC TGATTGAAGA TGACAAAGTT CTCCTGCAAC AACTGATTTC GACCATCTCT 
AACTGGAAGA ATGATCTCAA AACACCGTCC CAGGCGGCAG CAAGTGCGAT TGGCGAGCGG 
GACCGTATTT TTGCCCATTG TTATGGGCTG TATGATGCAC ACCTGAAAGC CTGTAACGTT 
CTCGACTTCG ATGATCTGAT TTTATTGCCG ACGTTGCTGC TGCAACGCAA TGAAGAAGTC 
CGCGAGCGCT GGCAGAACAA AATTCGCTAT CTGCTGGTGG ATGAGTATCA GGACACCAAC 
ACCAGCCAGT ATGAGCTGGT GAAACTGCTG GTGGGCAGCC GCGCGCGCTT TACCGTGGTG 
GGTGACGATG ACCAGTCGAT CTACTCCTGG CGCGGTGCAC GTCCGCAAAA CCTGGTGCTG 
CTGAGTCAGG ATTTTCCGGC GCTGAAGGTG ATTAAGCTTG AGCAGAACTA TCGCTCTTCC 
GGGCGTATTC TGAAAGCGGC GAACATCCTG ATCGCCAATA ACCCGCACGT CTTTGAAAAG 
CGTCTGTTCT CCGAACTGGG TTATGGCGCG GAGCTAAAAG TATTAAGCGC GAATAACGAA 
GAACATGAGG CTGAGCGCGT TACTGGCGAG CTGATCGCCC ATCACTTCGT CAATAAAACG 
CAGTACAAAG ATTACGCCAT TCTTTATCGC GGTAACCATC AGTCGCGGGT GTTTGAAAAA 
TTCCTGATGC AAAACCGCAT CCCGTACAAA ATATCTGGTG GTACGTCGTT TTTCTCTCGT 
CCTGAAATCA AGGACTTGCT GGCTTATCTG CGCGTGCTGA CTAACCCGGA CGATGACAGC 
GCATTTCTGC GTATCGTTAA CACGCCGAAG CGAGAGATTG GCCCGGCTAC GCTGAAAAAG 
CTGGGTGAGT GGGCGATGAC GCGCAATAAA AGCATGTTTA CCGCCAGCTT TGATATGGGC 
CTGAGTCAGA CGCTTAGCGG ACGTGGTTAT GAAGCATTGA CCCGCTTCAC TCACTGGTTG 
GCAGAAATCC AGCGTCTGGC GGAGCGGGAG CCGATTGCCG CGGTGCGTGA TCTGATCCAT 
GGCATGGATT ATGAATCCTG GCTGTACGAA ACATCGCCCA GCCCGAAAGC CGCCGAAATG 
CGCATGAAGA ACGTCAACCA ACTGTTTAGC TGGATGACGG AGATGCTGGA AGGCAGTGAA 
CTGGATGAGC CGATGACGCT CACCCAGGTG GTGACGCGCT TTACTTTGCG CGACATGATG 
GAGCGTGGTG AGAGTGAAGA AGAGCTGGAT CAGGTGCAAC TGATGACTCT CCACGCGTCG 
AAAGGGCTGG AGTTTCCTTA TGTCTACATG GTCGGTATGG AAGAAGGGTT TTTGCCGCAC 
CAGAGCAGCA TCGATGAAGA TAATATCGAT GAGGAGCGGC GGCTGGCCTA TGTCGGCATT 
ACCCGCGCCC AGAAGGAATT GACCTTTACG CTGTGTAAAG AACGCCGTCA GTACGGCGAA 
CTGGTGCGCC CGGAGCCGAG CCGCTTTTTG CTGGAGCTGC CGCAGGATGA TCTGATTTGG 
GAACAGGAGC GCAAAGTGGT CAGCGCCGAA GAACGGATGC AGAAAGGGCA AAGCCATCTG 
GCGAATCTGA AAGCGATGAT GGCGGCAAAA CGAGGGAAAT AA

Protein sequence

MRLNPGQQQA VEFVTGPCLV LAGAGSGKTR VITNKIAHLI RGCGYQARHI AAVTFTNKAA 
REMKERVGQT LGRKEARGLM ISTFHTLGLD IIKREYAALG MKANFSLFDD TDQLALLKEL 
TEGLIEDDKV LLQQLISTIS NWKNDLKTPS QAAASAIGER DRIFAHCYGL YDAHLKACNV 
LDFDDLILLP TLLLQRNEEV RERWQNKIRY LLVDEYQDTN TSQYELVKLL VGSRARFTVV 
GDDDQSIYSW RGARPQNLVL LSQDFPALKV IKLEQNYRSS GRILKAANIL IANNPHVFEK 
RLFSELGYGA ELKVLSANNE EHEAERVTGE LIAHHFVNKT QYKDYAILYR GNHQSRVFEK 
FLMQNRIPYK ISGGTSFFSR PEIKDLLAYL RVLTNPDDDS AFLRIVNTPK REIGPATLKK 
LGEWAMTRNK SMFTASFDMG LSQTLSGRGY EALTRFTHWL AEIQRLAERE PIAAVRDLIH 
GMDYESWLYE TSPSPKAAEM RMKNVNQLFS WMTEMLEGSE LDEPMTLTQV VTRFTLRDMM 
ERGESEEELD QVQLMTLHAS KGLEFPYVYM VGMEEGFLPH QSSIDEDNID EERRLAYVGI 
TRAQKELTFT LCKERRQYGE LVRPEPSRFL LELPQDDLIW EQERKVVSAE ERMQKGQSHL 
ANLKAMMAAK RGK