Gene Mext_0304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_0304
Symbol
ID	5832616
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	340156
End bp	341403
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	72%
IMG OID	641366089
Product	nuclease SbcCD, D subunit
Protein accession	YP_001637799
Protein GI	163849756
COG category	[L] Replication, recombination and repair
COG ID	[COG0420] DNA repair exonuclease
TIGRFAM ID	[TIGR00619] exonuclease SbcD

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.919689
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.177579
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCCGCG TTCTCCATAC GGGCGACTGG CATATCGGCC AGACGCTGCG CGGCTTCTCG 
CGCGAACGCG AACACGACGC GGTGTTCGGT TGTCTCGAGA GCATCGTCGT GGAGCGCGAG 
GTCGATGCCC TCGTCGTGGC CGGCGACGTG TTCGACAGCC AAAACCCGTC CGGCGAGTCG 
CAGGCCCGCT TCTACACCTT GATGGCGCGC CTCCACGCGG CGCGGCCGGC CATGACCATC 
GTCATCACCG CCGGCAATCA CGATGCCGCC GGGCGGCTGG AAGCACCGCG CCCGCTGCTC 
GAAGCCATCG GCGTCCACGT CGTCGGCAAT GTCCGCCGCC GCGATGGCGC GATCGACCTC 
GACCGGCACC TCGTTCCGGT TCGCTCGGCC AACGGGGAGG TGGCCGCGCA GGTGCTCGCC 
GTCTCCTATC CCACCGCCGC CTGCCTGCCG CCGCTCTCGT CGCTGGGTCA GCAGCCCCGC 
ATCGGCGAGA CGTCGCCGAT CGTGCGGGCG GTGCGCGACC TCTACGGCCA GCTCTTCGAG 
GCGGCCCGGC CGCGGCTCGC CGGCCTGCCG CTCCTCGTCA CCGGCCATCT CCATGTGGCC 
GGCGGGCTCG AATCGGAGGG GGCGGAGCGG CGCATCCTCG TCGGCGGTGA GCATGCCGTG 
CCGTCCGACG TGTTTCCGGA GGAAGCGCGC TACGTGGCGC TGGGCCATCT CCACCGGGCG 
CAGGTGCTGG GCCGGGGACA GGTGCGCTAT TGCGGCTCGC TGATCCCGCT CTCGGCGGCC 
GAGCAGCCCT ACCGCCACGG GGTCACCCTG GTGACGCTCG GCACCGGCGC CGCGGAGATC 
GAGCATATCG AGATCCCCCG CCCCGTGCCG TTCCTGCGCC TGCCGGCCTC GGGCGACATG 
CCGCTGGCCG ATCTCGGCGA CCATCTCAAC GCCCTGGCGC TCGACCCCGA TCTACCGATG 
GAGGCGCGGC CCTACATCCA GGTGCGGCTC GCCCGCGAGG GATTGCTGCC CGGCTACCGC 
GCCGAGGTGG ACCGCATTGC CGAGAGCTTT CCGGTGCGCG TGGTCGATGT GCGGGTGACG 
GTGCCGCCGC GGACCGCGAT CGCAATCGAG GAATCCGAAG CGCCGCCGCC GCGCCTGTCC 
GAGCGCGATC CGGAAGAGCT GTTCCGCCTT GCCTACCACG CCAAGTGGGA CGAGGACCCC 
GAGCCCGCCC ATCTCGACGT GTTCCACCGC GCACGAGCGG AAGCCTGA

Protein sequence

MIRVLHTGDW HIGQTLRGFS REREHDAVFG CLESIVVERE VDALVVAGDV FDSQNPSGES 
QARFYTLMAR LHAARPAMTI VITAGNHDAA GRLEAPRPLL EAIGVHVVGN VRRRDGAIDL 
DRHLVPVRSA NGEVAAQVLA VSYPTAACLP PLSSLGQQPR IGETSPIVRA VRDLYGQLFE 
AARPRLAGLP LLVTGHLHVA GGLESEGAER RILVGGEHAV PSDVFPEEAR YVALGHLHRA 
QVLGRGQVRY CGSLIPLSAA EQPYRHGVTL VTLGTGAAEI EHIEIPRPVP FLRLPASGDM 
PLADLGDHLN ALALDPDLPM EARPYIQVRL AREGLLPGYR AEVDRIAESF PVRVVDVRVT 
VPPRTAIAIE ESEAPPPRLS ERDPEELFRL AYHAKWDEDP EPAHLDVFHR ARAEA