Gene SbBS512_E2885 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2885
Symbol	xseA
ID	6269432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	2683679
End bp	2685049
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	53%
IMG OID	641726827
Product	exodeoxyribonuclease VII large subunit
Protein accession	YP_001881300
Protein GI	187731397
COG category	[L] Replication, recombination and repair
COG ID	[COG1570] Exonuclease VII, large subunit
TIGRFAM ID	[TIGR00237] exodeoxyribonuclease VII, large subunit

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000000000248025
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTACCTT CTCAATCCCC TGCAATTTTT ACCGTTAGTC GCCTGAATCA AACGGTTCGT 
CTGCTGCTTG AGCATGAGAT GGGACAGGTT TGGATCAGCG GCGAAATCTC TAATTTCACA 
CAACCGGCTT CCGGTCACTG GTACTTTACA CTCAAAGACG ACACCGCCCA GGTACGCTGC 
GCGATGTTCC GCAACAGCAA CCGCCGGGTG ACCTTCCGTC CACAGCATGG ACAACAAGTT 
TTAGTTCGCG CCAATATTAC GCTCTACGAG CCGCGCGGTG ACTACCAGAT AATCGTTGAG 
AGTATGCAGC CGGCCGGTGA AGGGCTGCTG CAACAGAAGT ACGAACAGCT CAAAGCGAAG 
TTGCAGGCTG AAGGTTTGTT CGATCAGCAA TACAAAAAAC CACTTCCCTC CCCTGCGCAT 
TGTGTTGGTG TGATCACCTC AAAAACCGGT GCTGCGCTAC ATGATATTTT GCATGTGTTA 
AAACGTCGCG ATCCTTCTCT ACCGGTGATC ATCTACCCCA CCGCCGTTCA GGGCGATGAC 
GCACCGGGGC AAATTGTTCG CGCCATTGAA CTGGCGAATC AGCGCAATGA GTGCGACGTG 
TTGATCGTTG GGCGCGGCGG CGGTTCGCTG GAAGATTTAT GGAGTTTTAA CGACGAACGC 
GTAGCGCGGG CGATTTTTGC CAGCCGCATT CCGGTCGTCA GCGCCGTCGG GCATGAGACG 
GATGTGACCA TTGCCGATTT TGTTGCCGAT CTGCGTGCGC CAACGCCGTC TGCCGCCGCT 
GAAGTAGTGA GCCGTAATCA GCAAGAGTTA CTGCGCCAGG TGCAATCGAC CCGTCAACGG 
CTGGAGATGG CGATGGATTA TTATCTCGCC AACCGCACGC GTCGCTTTAC GCAGATCCAT 
CACCGATTAC AGCAACAGCA TCCGCAGCTC CGGCTGGCAC GCCAGCAAAC CATGCTTGAG 
CGCCTGCAAA AGCGGATGAG CTTTGCGCTG GAAAATCAAC TTAAGCGTAC CGGGCAACAG 
CAGCAGCGGT TAACACAGCG GCTGAATCAG CAAAATCCAC AGCCGAAGAT TCATCGCGCG 
CAAACGCGCA TTCAGCAACT GGAATATCGT TTAGCAGAAA CCCTGCGCGT ACAGCTTAGC 
GCCACGCGTG AACGTTTCGG TAATGCAGTA ACGCACCTCG AAGCCGTAAG CCCACTGTCA 
ACGCTGGCGC GTGGATACAG CGTTACTACT GCTACTGACG GCAATGTACT GAAAAAAGTG 
AAGCAAGTTA AAGCGGGTGA AATGCTAACC ACACGTCTGG AAGACGGCTG GATAGAAAGT 
GAAGTTAAAA ACATCCAGCC AGTAAAAAAA TCGCGTAAAA AGGTGCATTA A

Protein sequence

MLPSQSPAIF TVSRLNQTVR LLLEHEMGQV WISGEISNFT QPASGHWYFT LKDDTAQVRC 
AMFRNSNRRV TFRPQHGQQV LVRANITLYE PRGDYQIIVE SMQPAGEGLL QQKYEQLKAK 
LQAEGLFDQQ YKKPLPSPAH CVGVITSKTG AALHDILHVL KRRDPSLPVI IYPTAVQGDD 
APGQIVRAIE LANQRNECDV LIVGRGGGSL EDLWSFNDER VARAIFASRI PVVSAVGHET 
DVTIADFVAD LRAPTPSAAA EVVSRNQQEL LRQVQSTRQR LEMAMDYYLA NRTRRFTQIH 
HRLQQQHPQL RLARQQTMLE RLQKRMSFAL ENQLKRTGQQ QQRLTQRLNQ QNPQPKIHRA 
QTRIQQLEYR LAETLRVQLS ATRERFGNAV THLEAVSPLS TLARGYSVTT ATDGNVLKKV 
KQVKAGEMLT TRLEDGWIES EVKNIQPVKK SRKKVH