Gene Msil_1434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1434
Symbol
ID	7091775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	1551613
End bp	1553652
Gene Length	2040 bp
Protein Length	679 aa
Translation table	11
GC content	65%
IMG OID	643464772
Product	excinuclease ABC, C subunit
Protein accession	YP_002361760
Protein GI	217977613
COG category	[L] Replication, recombination and repair
COG ID	[COG0322] Nuclease subunit of the excinuclease complex
TIGRFAM ID	[TIGR00194] excinuclease ABC, C subunit

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCCCAA CTGACAAAGA CGCTCCCGAG CCGGAGTCGC CGCCAGGCGC CGATAGCCCG 
CTGCCGCCGG AGTTCGATTT CGCCGTCGAG GATGGCGATG AGGAGATCCA GGACTTCGCC 
GATCTCGACC TTCCCGAGGA CGACGCCGCC CCCGCCTCGG TGCGGCGCGG CGCGGCCGTC 
ATCCGCAGCT TCTGGCGCCA GGCGCCGCAA GGTCCCGGCG TCTATCGCAT GATCGCCGCC 
GACGGAGAGG TGCTCTACGT CGGCAAGGCG AAGAGCGTGC GCAAGCGGAT CGCCAGCTAT 
ATGCGCCCGC TCGGCCACAA CAACCGGATC GCGCGGATGA TCGCGCTGAC CGCCTCGATG 
GTCTTCATCT CGACCAGCAC CGAGACGGAA GCGCTGCTGC TCGAGACGAA TTACATCAAG 
CAGATGAAGC CGCGCTTCAA CGTGCTGATG CGCGACGACA AGTCGTTCCC TTACATCCTT 
CTGACAGGCG ACCACGCGGC TCCGCAGATC CTGAAGCATC GCGGCGCGCG CAATCGAAAG 
GGCGACTATT TCGGGCCTTT CGCCAGCGTA TGGGCGGTCA ACCGCACCAT GAATGCGCTT 
GAGCGCGCCT TTCTCCTGCG CTCCTGCTCG GACAGCTATT ATGAAAACCG CACGCGGCCC 
TGTCTGCTGC ACCAGATCAA GCGCTGTTCG GCGCCCTGCA CCGGCGAGAT CGACCTTGAC 
GACTATCGCC GGCTGGTCGG CGAGGCGCGC GACTTTCTCT CCGGCAAGAG CCGCGCCGTG 
CGCGATCTTC TCGCGACCGA AATGACCAGC GCCTCGGACG CGCTTGAGTT CGAGCGCGCC 
GCGCGCCTGC GCGACCGCAT CGCCGCTCTC TCCGCCATCC AGGGCGCCCA GGGCGTCAAT 
CCAAAAACCG TCGAGGAGGC CGACGTCTTC GCGATCGTCG AGGAAGCCGG GCAATTCTGC 
GTCGAAGCCT TCTTTTTCCG CACCTACCAG AACTGGGGCA ACCGCGCCTA TTTTCCGCGC 
GCCGACAAGA GCCTGGCCTC CGCCGAGGTG CTCGACGCGT TTTTGGCGCA GTTTTACGCC 
GACAAGCCCG CTCCGCGGCT GATTTTGCTC TCGCATGAGA TCGAAAACGG CGCCGTGCTG 
AGCGAGGCTC TCTCCCTCCG CACCGGACAT CGAATCGAAA TCGCGCGGCC GCAGCGCGGG 
GAAAAGCATG AGCTCGTCGA ACATGCCTGC CAGAACGCAA GGGAGGCGAT GAGCCGCCGT 
CTGTCGGAAA CCGCCTCGCA GGAGAAGCTG CTGGCGGCGC TGGCGGCGGC GCTCGGCCTC 
TCCGCCCCTC TTCGGAGGGT CGAAATCTAC GACAATTCCC ATATCATGGG GACGAATGCG 
GTCGGAGCAA TGGTCGTCGC CGGCCCTGCC GGCTTCATGA AGGCGCATTA TCGCACCTTC 
AACATAAAGG GCGAGGATCT CACGCCGGGC GATGACTACG GTATGATGCG CGAAGTTCTG 
CGGCGTCGCT TTCTGAGGCT GGCCAAGGAC GAAGCGGCGG CGGACGGGCC CTCGACGCGA 
GACGACGATG AAGACATTTT CCCGCAGCGG CCGGATTTGA TCCTGATCGA CGGCGGCCAG 
GGTCAATTCG ACGCCGCCAA CGCCATTCTC GATGAATTAT CCGTGACCGG GGTCGCCGTG 
GCCGGGATCG CCAAGGGCGT CGACCGCAAC GCCGGCCGCG AAAGCTTTTT CGTCGCAGGC 
AAGGCGCCGT TCCGGCTCTC GCCGCGCGAT CCCGCCCTCT ATTTCGTGCA GAGGCTGCGC 
GACGAGGCGC ATCGTTTCGC GATTGGGACG CATCGCGCCC GCCGTAAGAA GGAATTTACC 
CGCAGTCCGC TCGACGAGAT CGCCGGCGTC GGCCCGGCGC GCAAGCGCGC CCTGCTGCAC 
GCTTTCGGCA CCGCCAAGGC GATTTCAAAG GCCGCTTTAT CCGATCTCGA AAAAGTCGCG 
GGCGTCAATG CGGCGACGGC GCGGCTCGTT TATAACTATT TCCACGAGGG CGGCGGCTAA

Protein sequence

MVPTDKDAPE PESPPGADSP LPPEFDFAVE DGDEEIQDFA DLDLPEDDAA PASVRRGAAV 
IRSFWRQAPQ GPGVYRMIAA DGEVLYVGKA KSVRKRIASY MRPLGHNNRI ARMIALTASM 
VFISTSTETE ALLLETNYIK QMKPRFNVLM RDDKSFPYIL LTGDHAAPQI LKHRGARNRK 
GDYFGPFASV WAVNRTMNAL ERAFLLRSCS DSYYENRTRP CLLHQIKRCS APCTGEIDLD 
DYRRLVGEAR DFLSGKSRAV RDLLATEMTS ASDALEFERA ARLRDRIAAL SAIQGAQGVN 
PKTVEEADVF AIVEEAGQFC VEAFFFRTYQ NWGNRAYFPR ADKSLASAEV LDAFLAQFYA 
DKPAPRLILL SHEIENGAVL SEALSLRTGH RIEIARPQRG EKHELVEHAC QNAREAMSRR 
LSETASQEKL LAALAAALGL SAPLRRVEIY DNSHIMGTNA VGAMVVAGPA GFMKAHYRTF 
NIKGEDLTPG DDYGMMREVL RRRFLRLAKD EAAADGPSTR DDDEDIFPQR PDLILIDGGQ 
GQFDAANAIL DELSVTGVAV AGIAKGVDRN AGRESFFVAG KAPFRLSPRD PALYFVQRLR 
DEAHRFAIGT HRARRKKEFT RSPLDEIAGV GPARKRALLH AFGTAKAISK AALSDLEKVA 
GVNAATARLV YNYFHEGGG