Gene Shewmr4_2061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_2061
Symbol
ID	4252634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	2451855
End bp	2453876
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	52%
IMG OID	638118680
Product	excinuclease ABC subunit B
Protein accession	YP_734191
Protein GI	113970398
COG category	[L] Replication, recombination and repair
COG ID	[COG0556] Helicase subunit of the DNA excision repair complex
TIGRFAM ID	[TIGR00631] excinuclease ABC, B subunit

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000836148
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCAGAAT CTGTTTTTCA GCTTGAATCT CAATTTGCTC CCGCAGGGGA TCAGCCCACG 
GCCATTGCCA AGTTGGTCGA TGGCTTAGAA TCGGGCCTAG CTTGCCAAAC CCTATTGGGG 
GTAACAGGCT CGGGCAAGAC ATTCACTATC GCCAATGTGA TCGCCCAACT GGGGCGCCCA 
ACCATTATTA TGGCGCCAAA CAAGACGCTG GCGGCGCAGC TTTATGGCGA GATGAAAGAG 
TTTTTCCCCA ATAATGCGGT GGAATACTTT GTCTCCTATT ACGATTATTA CCAGCCAGAA 
GCCTATGTGC CCGCATCAAA CACCTTTATT GAAAAGGATG CGTCGGTTAA CGCCCATATC 
GAGCAAATGC GACTCTCGGC GACTAAAGCC TTGTTGGAGC GTAAGGATGT CGTCTTGATT 
GCCTCTGTAT CGGCAATTTA CGGTCTGGGC GATCCCGATT CCTACATGAA GATGCTTTTG 
CACCTACGCC AGGGCGATAC CATGGGGCAG CGGGATATTC TTAAGCGCTT GAGTGAGCTG 
CAATATACTC GTAACGATCT CGAGTTGCAG CGCGGTACTT TCCGCGCCCG TGGTGAAGTT 
ATCGATATTT TCCCCGCCGA TTCTGACCGC TACGGGATTC GGGTAGAACT CTTTGACGAT 
GAAATTGAGC GCCTAAGCGA ATTTGACCCG TTAACGGGGC AGATAGTTAA GCGTATCGCG 
CGCACCACTG TGTATCCCAA AACCCACTAT GTGACGCCAC GGGAAAAAAT CCTTGAAGCG 
ACTGAGTCAA TTAAGCAAGA GCTGCGCGAG CGTAAGCAGT ATCTGCTCGA CAACAATAAG 
CTCATCGAAG CGCAGCGGAT CCATGAGCGG GTGCAATACG ATATCGAGAT GATGGTTGAG 
TTGGGTTATT GCTCCGGCAT TGAGAACTAC TCCCGCTATT TGTCGGGACG GGCGCCGGGA 
GAAGGGCCAC CAACCTTGCT GGATTATTTA CCCGCCGATG GTTTGTTGAT CATCGACGAG 
TCCCACGTCA CTGTGCCGCA AATTGGTGCC ATGTATAAGG GTGACCGCTC CCGTAAGACC 
ACGCTTGTGG AATATGGCTT CCGTTTACCC TCGGCGCTGG ATAACCGGCC ATTGAAGTTC 
GAAGAGTTTG AGCAATTGAT GCCGCAGACC ATTTATGTGT CGGCAACGCC TAATCCTTAC 
GAACTGGAGA AAAGCGACGG CGAGATTGTT GAGCAAGTCG TGCGGCCAAC GGGATTGCTC 
GATCCCGAGT TAGAAGTGCG CCCGGTTAGC ATTCAAGTGG ATGATTTACT CTCCGAGGTC 
GCTAAACGCG TCGCCGTCAA TGAGCGGGTG CTTGTTACCA CCTTAACCAA GCGCATGTCG 
GAGGATTTAA CCGAATACCT CGATGAACAT GGCGTCAAAG TCCGTTATTT GCACTCGGAT 
ATCGATACCG TGGAGCGGGT GGAGATCATT CGCGATCTGC GCCTTGGTAA GTTTGATGTG 
CTGGTCGGTA TCAACTTGTT ACGCGAAGGC TTAGATATGC CGGAAGTCTC CTTGGTCTGT 
ATTCTCGATG CGGATAAGGA AGGCTTTTTA CGTTCGGAGC GTTCACTGAT TCAGACCATT 
GGTCGCGCCG CTCGTAACGT CAATGGCAAG GTTATCCTCT ATGCGGATAG GATCACTCAG 
TCGATGGCCA AGGCGATGGG AGAAACTGAG CGCCGCCGTG AGAAACAGCG CGCCTACAAT 
CTTGAGCACG GCATTGTGCC TAAAGGGGTG GTGAAACGCA TTACCGACGT AATGGATGTC 
GATGATGGTA GAGAGTCTGA AAAAGGTTAT CGTCAGTCAT CACTGAATAA AGTGGCTGAA 
CCTAAAGCCA AACGTTATCA AGCCGATGCG GCGCAGCTGA GCCATGATAT CGACAAGCTC 
GAGAAGCAAA TGCATGAACA TGCGCGTAAC TTGGAGTTTG AACAGGCAGC GGCGCTACGC 
GATGAGGTGA AACGGTTACG GGAGTTGCTG ATCACCGCTT AA

Protein sequence

MSESVFQLES QFAPAGDQPT AIAKLVDGLE SGLACQTLLG VTGSGKTFTI ANVIAQLGRP 
TIIMAPNKTL AAQLYGEMKE FFPNNAVEYF VSYYDYYQPE AYVPASNTFI EKDASVNAHI 
EQMRLSATKA LLERKDVVLI ASVSAIYGLG DPDSYMKMLL HLRQGDTMGQ RDILKRLSEL 
QYTRNDLELQ RGTFRARGEV IDIFPADSDR YGIRVELFDD EIERLSEFDP LTGQIVKRIA 
RTTVYPKTHY VTPREKILEA TESIKQELRE RKQYLLDNNK LIEAQRIHER VQYDIEMMVE 
LGYCSGIENY SRYLSGRAPG EGPPTLLDYL PADGLLIIDE SHVTVPQIGA MYKGDRSRKT 
TLVEYGFRLP SALDNRPLKF EEFEQLMPQT IYVSATPNPY ELEKSDGEIV EQVVRPTGLL 
DPELEVRPVS IQVDDLLSEV AKRVAVNERV LVTTLTKRMS EDLTEYLDEH GVKVRYLHSD 
IDTVERVEII RDLRLGKFDV LVGINLLREG LDMPEVSLVC ILDADKEGFL RSERSLIQTI 
GRAARNVNGK VILYADRITQ SMAKAMGETE RRREKQRAYN LEHGIVPKGV VKRITDVMDV 
DDGRESEKGY RQSSLNKVAE PKAKRYQADA AQLSHDIDKL EKQMHEHARN LEFEQAAALR 
DEVKRLRELL ITA