Gene EcSMS35_4142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4142
Symbol	rep
ID	6146748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4240324
End bp	4242345
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	54%
IMG OID	641618965
Product	ATP-dependent DNA helicase Rep
Protein accession	YP_001746097
Protein GI	170680827
COG category	[L] Replication, recombination and repair
COG ID	[COG0210] Superfamily I DNA and RNA helicases
TIGRFAM ID	[TIGR01074] ATP-dependent DNA helicase Rep

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.11002
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCTAA ACCCCGGCCA ACAACAAGCT GTCGAATTCG TTACCGGCCC CTGCCTGGTG 
CTGGCAGGCG CGGGTTCCGG TAAAACTCGT GTCATCACCA ATAAAATCGC CCATCTGATC 
CGCGGTTGCG GTTATCAGGC GCGACATATC GCGGCGGTGA CCTTTACCAA TAAGGCGGCG 
CGCGAGATGA AAGAGCGTGT CGGGCAGACG CTGGGGCGCA AAGAGGCGCG CGGGCTGATG 
ATTTCCACCT TCCACACGCT GGGGCTGGAT ATCATCAAGC GTGAGTATGC GGCGTTGGGG 
ATGAAAGCGA ACTTTTCGCT GTTTGATGAC ACCGATCAGC TGGCGTTGCT TAAAGAGCTG 
ACCGAGGGGC TGATTGAAGA TGACAAAGTC CTCCTGCAAC AGCTGATTTC GACCATCTCT 
AACTGGAAGA ACGATCTCAA AACACCGTCC CAGGCGGCAG CCAGTGCGAT TGGCGAGCGG 
GACCGTATTT TTGCCCATTG TTATGGGCTG TATGATGCAC ACCTGAAAGC CTGTAACGTT 
CTCGACTTCG ATGATCTGAT TTTATTGCCG ACGTTACTGC TGCAACGCAA TGAAGAAGTC 
CGCGAGCGCT GGCAGAACAA AATTCGCTAC CTGCTGGTGG ATGAGTATCA GGACACCAAC 
ACCAGCCAGT ATGAACTGGT GAAACTGCTG GTGGGCAGCC GCGCGCGCTT TACCGTAGTT 
GGCGATGACG ATCAGTCGAT CTACTCCTGG CGCGGTGCAC GTCCGCAAAA CCTGGTGCTG 
TTGAGTCAGG ATTTCCCGGC ACTGAAGGTG ATTAAGCTTG AGCAGAACTA CCGCTCTTCC 
GGACGTATTC TGAAAGCGGC GAACATCCTG ATCGCCAATA ACCCGCACGT CTTTGAAAAG 
CGTCTGTTCT CCGAACTGGG CTATGGCGCG GAGCTAAAAG TTTTAAGCGC GAATAACGAA 
GAACATGAAG CCGAGAGAGT CACCGGCGAG CTGATCGCGC ATCACTTCGT CAATAAAACG 
CAGTACAAAG ATTACGCCAT TCTTTATCGC GGCAACCATC AGTCGCGGGT GTTTGAAAAA 
TTCCTGATGC AAAACCGCAT CCCGTACAAA ATTTCTGGTG GTACGTCGTT TTTCTCTCGC 
CCTGAAATCA AGGATTTGCT GGCTTATCTG CGCGTGCTGA CTAACCCGGA CGATGACAGC 
GCATTCCTGC GTATCGTTAA CACGCCGAAG CGAGAGATTG GCCCGGCTAC GCTGAAAAAG 
CTGGGTGAGT GGGCGATGAC GCGCAATAAA AGCATGTTTA CCGCCAGCTT TGATATGGGC 
CTGAGTCAGA CGCTTAGCGG ACGTGGTTAT GAAGCATTGA CCCGCTTCAC TCACTGGTTG 
GCAGAAATCC AGCGCCTGGC GGAGCGAGAG CCGATTGCCG CGGTGCGTGA TCTGATTCAC 
GGCATGGATT ATGAATCCTG GCTGTACGAA ACATCGCCCA GCCCGAAAGC CGCCGAAATG 
CGCATGAAGA ACGTCAACCA ACTGTTTAGC TGGATGACGG AGATGCTCGA AGGCAGTGAA 
CTGGATGAGC CGATGACGTT AACCCAGGTG GTGACGCGCT TTACTTTGCG CGACATGATG 
GAGCGTGGTG AGAGTGAAGA AGAGCTGGAT CAGGTGCAAC TGATGACTCT CCACGCGTCG 
AAAGGGCTGG AGTTTCCTTA TGTCTACATG GTCGGTATGG AAGAAGGGTT TTTGCCGCAC 
CAGAGCAGCA TCGATGAAGA TAATATCGAT GAGGAGCGGC GGCTGGCCTA TGTCGGCATT 
ACCCGCGCCC AGAAGGAATT GACCTTTACG CTGTGTAAAG AACGCCGTCA GTACGGCGAA 
CTGGTGCGCC CGGAGCCGAG CCGCTTTTTG CTGGAGCTGC CGCAGGATGA TCTGATTTGG 
GAACAGGAGC GCAAAGTGGT CAGCGCCGAA GAACGGATGC AGAAAGGGCA AAGCCATCTG 
GCGAATCTGA AAGCGATGAT GGCGGCAAAA CGAGGGAAAT AA

Protein sequence

MRLNPGQQQA VEFVTGPCLV LAGAGSGKTR VITNKIAHLI RGCGYQARHI AAVTFTNKAA 
REMKERVGQT LGRKEARGLM ISTFHTLGLD IIKREYAALG MKANFSLFDD TDQLALLKEL 
TEGLIEDDKV LLQQLISTIS NWKNDLKTPS QAAASAIGER DRIFAHCYGL YDAHLKACNV 
LDFDDLILLP TLLLQRNEEV RERWQNKIRY LLVDEYQDTN TSQYELVKLL VGSRARFTVV 
GDDDQSIYSW RGARPQNLVL LSQDFPALKV IKLEQNYRSS GRILKAANIL IANNPHVFEK 
RLFSELGYGA ELKVLSANNE EHEAERVTGE LIAHHFVNKT QYKDYAILYR GNHQSRVFEK 
FLMQNRIPYK ISGGTSFFSR PEIKDLLAYL RVLTNPDDDS AFLRIVNTPK REIGPATLKK 
LGEWAMTRNK SMFTASFDMG LSQTLSGRGY EALTRFTHWL AEIQRLAERE PIAAVRDLIH 
GMDYESWLYE TSPSPKAAEM RMKNVNQLFS WMTEMLEGSE LDEPMTLTQV VTRFTLRDMM 
ERGESEEELD QVQLMTLHAS KGLEFPYVYM VGMEEGFLPH QSSIDEDNID EERRLAYVGI 
TRAQKELTFT LCKERRQYGE LVRPEPSRFL LELPQDDLIW EQERKVVSAE ERMQKGQSHL 
ANLKAMMAAK RGK