Gene EcolC_4186 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4186
Symbol
ID	6067433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4623848
End bp	4625677
Gene Length	1830 bp
Protein Length	609 aa
Translation table	11
GC content	55%
IMG OID	641603614
Product	ATP-dependent DNA helicase RecQ
Protein accession	YP_001727110
Protein GI	170022156
COG category	[L] Replication, recombination and repair
COG ID	[COG0514] Superfamily II DNA helicase
TIGRFAM ID	[TIGR00614] ATP-dependent DNA helicase, RecQ family [TIGR01389] ATP-dependent DNA helicase RecQ

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.802851
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGCAGG CGGAAGTGTT GAATCTGGAG TCCGGAGCTA AACAGGTTTT ACAAGAAACC 
TTTGGCTACC AACAGTTTCG CCCCGGCCAG GAAGAAATTA TCGACACTGT GCTTTCCGGT 
CGCGATTGCC TGGTCGTCAT GCCCACCGGT GGCGGAAAAT CCCTTTGCTA TCAAATTCCT 
GCCTTATTGC TAAACGGCCT TACCGTGGTT GTTTCACCGC TGATTTCGTT GATGAAAGAT 
CAGGTGGATC AACTGCAAGC CAACGGCGTG GCGGCGGCGT GCCTTAACTC GACGCAAACC 
CGCGAACAGC AACTTGAAGT GATGACAGGC TGCCGCACCG GGCAAATTCG CTTACTGTAT 
ATCGCCCCGG AACGCCTGAT GCTGGATAAC TTTCTTGAGC ATCTGGCGCA CTGGAATCCG 
GTGTTATTAG CCGTCGATGA AGCGCACTGT ATCTCCCAAT GGGGCCACGA TTTCCGCCCG 
GAATATGCCG CGCTCGGTCA GTTGCGCCAG CGGTTCCCGA CGCTGCCGTT TATGGCGCTG 
ACCGCCACAG CCGACGACAC CACGCGCCAG GATATCGTGC GCCTGCTGGG GCTGATCGAT 
CCGCTGATTC AAATCAGCAG TTTTGACCGT CCGAATATTC GCTACATGCT GATGGAGAAG 
TTCAAACCGC TCGATCAGTT GATGCGCTAC GTGCAGGAAC AGCGCGGTAA GTCAGGCATT 
ATCTACTGCA ACAGCCGCGC GAAAGTAGAA GACACCGCTG CGCGCCTGCA AAGCAAGGGA 
ATTAGCGCGG CGGCCTATCA TGCCGGGCTG GAAAATAATG TTCGCGCCGA TGTGCAGGAA 
AAATTCCAGC GCGATGACCT GCAAATTGTG GTGGCGACGG TGGCGTTCGG CATGGGCATC 
AATAAACCAA ACGTTCGCTT CGTGGTCCAC TTTGATATTC CGCGCAATAT CGAATCCTAT 
TATCAGGAAA CCGGACGCGC CGGGCGTGAT GGCCTGCCCG CGGAAGCGAT GCTGTTTTAC 
GATCCGGCTG ATATGGCGTG GCTGCGCCGT TGTCTGGAAG AGAAGCCGCA GGGGCAGTTG 
CAGGATATCG AGCGCCACAA ACTCAATGCG ATGGGCGCGT TTGCCGAAGC GCAAACTTGC 
CGTCGTCTGG TATTGCTGAA CTATTTTGGC GAAGGGCGTC AGGAGCCGTG CGGGAACTGC 
GATATCTGCC TCGATCCGCC GAAACAGTAC GACGGTTCAA CCGATGCTCA GATTGCCCTT 
TCCACCATTG GTCGTGTGAA TCAGCGGTTT GGGATGGGTT ATGTGGTGGA AGTGATTCGT 
GGTGCTAATA ACCAGCGTAT CCGCGACTAT GGTCATGACA AACTGAAAGT CTATGGCATG 
GGCCGTGATA AAAGCCATGA ACATTGGGTG AGCGTGATCC GCCAGCTGAT TCACCTCGGC 
CTGGTGACGC AAAATATTGC CCAGCATTCT GCCCTACAAC TGACAGAGGC CGCGCGCCCG 
GTGCTGCGCG GCGAATCCTC TTTGCAACTT GCCGTGCCGC GTATCGTGGC GCTCAAACCG 
AAAGCGATGC AGAAATCGTT CGGCGGCAAC TATGATCGCA AACTGTTCGC CAAATTACGC 
AAACTGCGTA AATCGATTGC CGATGAAAGC AATGTCCCGC CGTACGTGGT GTTTAACGAC 
GCAACCTTGA TTGAGATGGC TGAACAGATG CCGATCACCG CCAGCGAAAT GCTCAGCGTT 
AACGGCGTTG GGATGCGCAA GCTGGAACGC TTTGGTAAAC CGTTTATGGC GCTTATCCGC 
GCGCATGTTG ACGGCGACGA CGAAGAGTAG

Protein sequence

MAQAEVLNLE SGAKQVLQET FGYQQFRPGQ EEIIDTVLSG RDCLVVMPTG GGKSLCYQIP 
ALLLNGLTVV VSPLISLMKD QVDQLQANGV AAACLNSTQT REQQLEVMTG CRTGQIRLLY 
IAPERLMLDN FLEHLAHWNP VLLAVDEAHC ISQWGHDFRP EYAALGQLRQ RFPTLPFMAL 
TATADDTTRQ DIVRLLGLID PLIQISSFDR PNIRYMLMEK FKPLDQLMRY VQEQRGKSGI 
IYCNSRAKVE DTAARLQSKG ISAAAYHAGL ENNVRADVQE KFQRDDLQIV VATVAFGMGI 
NKPNVRFVVH FDIPRNIESY YQETGRAGRD GLPAEAMLFY DPADMAWLRR CLEEKPQGQL 
QDIERHKLNA MGAFAEAQTC RRLVLLNYFG EGRQEPCGNC DICLDPPKQY DGSTDAQIAL 
STIGRVNQRF GMGYVVEVIR GANNQRIRDY GHDKLKVYGM GRDKSHEHWV SVIRQLIHLG 
LVTQNIAQHS ALQLTEAARP VLRGESSLQL AVPRIVALKP KAMQKSFGGN YDRKLFAKLR 
KLRKSIADES NVPPYVVFND ATLIEMAEQM PITASEMLSV NGVGMRKLER FGKPFMALIR 
AHVDGDDEE