Gene BLD_1960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BLD_1960
Symbol	hsdS3
ID	6363795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bifidobacterium longum DJO10A
Kingdom	Bacteria
Replicon accession	NC_010816
Strand	+
Start bp	2338749
End bp	2339990
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	46%
IMG OID	642681169
Product	restriction endonuclease S subunit
Protein accession	YP_001955903
Protein GI	189440822
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.323459
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGAAC AGGCGAAAGT TCCTGCGATT CGCTTTGCTG GTTTTACTGA CCCTTGGGAA 
CAGCGTAAGT TGGGCGAGAT TGCCGATAAG GTGACAGAAA AAAATCTTGA TGGAAACATC 
ACCGAGGTTC TTACCAACTC TGCAGAATAC GGTGTAATTA ATCAAACCGA GTTCTTCGAC 
CACGCTGTCG CCAAGGAATC CAACATTGCT GGTTATTATG TCATTGCTCC AGGGGATTTC 
GTGTACAACC CTCGCATCTC CGCAACAGCG CCTGTTGGCC CAATCCGTAG GAATACGTTG 
GGAATACACG GAGTTATGTC TCCTCTCTAC ACTGTATTCA GGCTTACAGA TGCAGTCGAT 
GGAACTTATC TCAGCCACTT CTTCAAGACA AATGGCTGGC ATGGTTTCAT GAAGCTGGAA 
GGTAATTCGG GAGCCAGATC AGATAGGTTC TCAATCGGTG ATGCGACATT CTTTGAAATG 
CCAATCCCAG TTCCATCTTC AAGTGAACAA TATGCTATAG GCTCCTTCTT TTCCCGTCTC 
GACGACCTCA TCACCCTTCA TCAGCGTAAG TATGACAAGC TCGTCATCTT CAAAAAATCG 
ATGCTTGAAA AAATGTTCCC GAAGGATGGC GAATCTGTAC CCGAAATTCG CTTTGCTGGT 
TTTACTGACC CTTGGGAACA GCGTAAGTTG GGCGAGATTG CCGATAAGGT GACAGCAAAA 
AATCTTGATG GAAACATCAC CGAGGTTCTT ACCAACTCTG CAGAATACGG TGTAATTAAT 
CAAACCGAGT TCTTCGACCA CGCTGTCGCC AAGGAATCCA ACATTGCTGG TTATTATGTC 
ATTGCTCCAG GGGATTTCGT GTACAACCCT CGCATCTCCG CAACAGCGCC TGTTGGCCCA 
ATCCGTAGGA ATACGTTGGG AATACACGGA GTTATGTCTC CTCTCTACAC TGTATTCAGG 
CTTACAGATG CAGTCGATGG AACTTATCTC AGCCACTTCT TCAAGACAAA TGGCTGGCAT 
GGTTTCATGA AGCTGGAAGG TAATTCGGGA GCCAGATCAG ATAGGTTCTC AATCGGTGAT 
GCGACATTCT TTGAAATGCC AATCCCAGTT CCATCTTCAA GTGAACAACA TGCTATAGGC 
TCCTTCTTTT CCCGTCTTGA CAACCTCATC ACTCTTCATC AGCGTAAGTT GGAATTGCTG 
CAGGATATCA AGAAATCTTT GCTTGACAAG ATGTTTGTGT GA

Protein sequence

MTEQAKVPAI RFAGFTDPWE QRKLGEIADK VTEKNLDGNI TEVLTNSAEY GVINQTEFFD 
HAVAKESNIA GYYVIAPGDF VYNPRISATA PVGPIRRNTL GIHGVMSPLY TVFRLTDAVD 
GTYLSHFFKT NGWHGFMKLE GNSGARSDRF SIGDATFFEM PIPVPSSSEQ YAIGSFFSRL 
DDLITLHQRK YDKLVIFKKS MLEKMFPKDG ESVPEIRFAG FTDPWEQRKL GEIADKVTAK 
NLDGNITEVL TNSAEYGVIN QTEFFDHAVA KESNIAGYYV IAPGDFVYNP RISATAPVGP 
IRRNTLGIHG VMSPLYTVFR LTDAVDGTYL SHFFKTNGWH GFMKLEGNSG ARSDRFSIGD 
ATFFEMPIPV PSSSEQHAIG SFFSRLDNLI TLHQRKLELL QDIKKSLLDK MFV