Gene Rleg_4549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4549
Symbol	xseA
ID	8015305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	4676974
End bp	4678554
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	67%
IMG OID	644827126
Product	exodeoxyribonuclease VII large subunit
Protein accession	YP_002978326
Protein GI	241207230
COG category	[L] Replication, recombination and repair
COG ID	[COG1570] Exonuclease VII, large subunit
TIGRFAM ID	[TIGR00237] exodeoxyribonuclease VII, large subunit

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACG TCTTCGACGG CGATTCGCCG ACCAACCTTG CCGAATATTC GGTTTCGGAA 
CTTTCCGGCT CGATCAAGCG CACCGTCGAA ACCGCCTTCG ACCAGGTTCG CGTGCGCGGC 
GAAATATCAG GCTATCGTGG GCCGCACTCC TCGGGCCATG CCTATTTCGC GCTGAAGGAC 
GATCGCGCCC GCATCGACGC TGTCATCTGG AAGGGCACCT TCTCACGACT GAAGTTCCGT 
CCGGAAGAGG GCATGGAAGT CATCGCCACC GGCAAGGTCA CCACCTTTCC GGGTTCCTCG 
AAATATCAGA TCGTCATCGA GACGCTGGAG CCGGCCGGCG CCGGCGCGCT GATGGCGCTG 
ATCGAGGAGC GCAAGCGCAA GCTCGGCGCC GAGGGCCTGT TCGATGCCGC CCGCAAAAAG 
CGGCTGCCCT TCATGCCCGG CGTAATCGGC GTCGTCACCT CGCCGACCGG CGCCGTCATC 
CGCGATATCC TTCACCGCAT CTCCGATCGT TTTCCTGTGC ATGTCCTCGT CTGGCCGGTG 
AAGGTCCAGG GCGAGGGCTC CGGCGAGGAG GTGGCGAACG CCATCCGCGG CTTCAACGCG 
CTGGAACCTT CAGGCGCCAT CCCGCGCCCG GATGTGTTGA TCGTCGCACG CGGCGGCGGC 
AGCCTGGAAG ATCTCTGGAG CTTCAACGAC GAAATCGTCG TGCGTGCTGC GGCCGAAAGC 
CGGATACCGC TGATCTCGGC CGTCGGCCAT GAGACCGACT GGACGCTGAT CGACTACGCC 
GCCGATGTCC GTGCGCCCAC GCCGACGGGG GCAGCGGAAA TGGCAGTGCC GGTCAAGGCG 
GAGCTCGAGG CGCAGGCCGC CGCTCTTGCC GCGCGCCTGC AGGGCTGCAT GAACCGGCAG 
ATGGATCAGC GCCGCCAGTC GGTGCGTGCT CTGATGCGGG CATTGCCGTC GCTCGATCAG 
CTTCTCGCCT TGCCGCGCCG CCGTTTCGAC GAGGCGGCAA CCGGTCTCGG CCGCGGGCTG 
GAGCTCAACA CTATCAACAA GCGCCGCGGC TTCGAGCGTG TCGCCGCGCA TCTGCGCCCC 
GATCTGCTCG CCGGCCGCAT CGCCGAGCGC CGCCAGACGC TGAACGAGCG CATGGCCCGG 
GCCGAGCGCA TGGTTGAGCG GCTGATCGAC CGTTCGAAAT CGCGCGTCGA CCGCGCCGAA 
GCCATCCTCG CCTCACTGCC GGCCCGGCTG AAGACCCAGA CCGACCGCGG TCGCGAACGC 
CTCGGCAATC TTTCGCGCCA TGCCGATACG GCGGTCCGCC ACCAGCTGAC CCGCGCGCGC 
GCCGAACTTT CTTCGCAGGA CCGCGTGCTG CAATCGCTCT CCTACAAGAA TGTGCTGAAG 
CGCGGCTATG CCGTCATTCG CGATGAGGAT AACAGGCCGG TCTCGCAGGC TGCTCAGCTC 
TCCGCCGGCA TGGGCATCGC CATCGAATTC GCCGACGGCC GTGTCGGCGC CATGACCACG 
GAAGGCGGCG CACCGCCGGC CGGGGCCAAG AAGCGCAGCG CAAGACCCGC AGACCCACCG 
AAGCAGGGAA GCCTGTTCTG A

Protein sequence

MSNVFDGDSP TNLAEYSVSE LSGSIKRTVE TAFDQVRVRG EISGYRGPHS SGHAYFALKD 
DRARIDAVIW KGTFSRLKFR PEEGMEVIAT GKVTTFPGSS KYQIVIETLE PAGAGALMAL 
IEERKRKLGA EGLFDAARKK RLPFMPGVIG VVTSPTGAVI RDILHRISDR FPVHVLVWPV 
KVQGEGSGEE VANAIRGFNA LEPSGAIPRP DVLIVARGGG SLEDLWSFND EIVVRAAAES 
RIPLISAVGH ETDWTLIDYA ADVRAPTPTG AAEMAVPVKA ELEAQAAALA ARLQGCMNRQ 
MDQRRQSVRA LMRALPSLDQ LLALPRRRFD EAATGLGRGL ELNTINKRRG FERVAAHLRP 
DLLAGRIAER RQTLNERMAR AERMVERLID RSKSRVDRAE AILASLPARL KTQTDRGRER 
LGNLSRHADT AVRHQLTRAR AELSSQDRVL QSLSYKNVLK RGYAVIRDED NRPVSQAAQL 
SAGMGIAIEF ADGRVGAMTT EGGAPPAGAK KRSARPADPP KQGSLF