Gene CHU_3351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CHU_3351
Symbol	hsdS
ID	4185046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cytophaga hutchinsonii ATCC 33406
Kingdom	Bacteria
Replicon accession	NC_008255
Strand	+
Start bp	3830174
End bp	3831238
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	33%
IMG OID	638073340
Product	type I site-specific deoxyribonuclease S subunit
Protein accession	YP_679930
Protein GI	110639720
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.00146581
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0102246
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGATTTC CTGAGTTTGA TGAGGAATGG GAAGAGAAAA CGTTGGGGGA GATCTGTGAA 
ATGCAAGCTG GAAAATTCGT TAGTGCTAGT GAAATAAAAG AGCAGCATTT TGACGGCTTA 
TTTCCTTGTT ATGGTGGAAA TGGATTAAGA GGTTATACTA AATCATATAA TTACGATGGT 
AAATATTCCT TAATTGGTCG ACAGGGAGCA TTATGTGGCA ATGTAAATTT TGCTAATGGA 
AAATTTCATG CAACAGAGCA TGCAGTGGTT GTCACCCCGT TAAATGGCAT TAATACAGTT 
TGGATGTTTT ACTTGTTAAC AAATTTGAAT TTAAATCAAT TTGCTACAGG CATGGCCCAA 
CCAGGACTAT CTGTACAAAA TTTAGAAAAG GTTGAGAGTA CAATTCCTAA AGCTATAGAT 
GAGCAAGAAA AAATTGCTTC TTTTCTAACG CTAATTGACG GACGTATCTC AACTCAAAAC 
AAAATAATTA AGGAATTAGA ATTACTTATT AAATCAATTA GCCAAATTAT ATTTCATGGA 
CACAGATATA AATTCAAAAA AGCAAGCTTA GGTTCAATCT GCACTATAAA AAAAGGCGAG 
CAAATTAACA GTTCGGTGTT AAGTGAATCA GGACTTTACG CAGTAATGAA TGGAGGAATT 
ACTCCATCGG GATATTACTC ACAATATAAT TGTGTTGGTA ATACTATCTC TATTAGCGAA 
GGAGGAAATT CATGCGGCTA TGTCCAATTC AATGATAAGA AATTTTGGAG CGGGGGACAT 
TGTTACACAC TATCCGAAAT CAACGCAGAA ATTTCTAATA AATACCTATA TTACTTTATG 
AAATTCTCTG AGAATTTAAT AATGTCTCTT CGCGTAGGCT CGGGATTACC TAATATCCAG 
AAAAAAGATC TTGAAAAATT CAATGTAGCC TTTCCTGAAA TAAATCAACA GTATCAAATC 
TCTAAATTTT TGGATCTTTT AACAGAAAAG ATCCAAGTTG AAAAATCTCT TAAAACTTCC 
TTAATAAGGC AGAAGCAGTA TGTACTAAAA AAAATGTTCA TATAA

Protein sequence

MRFPEFDEEW EEKTLGEICE MQAGKFVSAS EIKEQHFDGL FPCYGGNGLR GYTKSYNYDG 
KYSLIGRQGA LCGNVNFANG KFHATEHAVV VTPLNGINTV WMFYLLTNLN LNQFATGMAQ 
PGLSVQNLEK VESTIPKAID EQEKIASFLT LIDGRISTQN KIIKELELLI KSISQIIFHG 
HRYKFKKASL GSICTIKKGE QINSSVLSES GLYAVMNGGI TPSGYYSQYN CVGNTISISE 
GGNSCGYVQF NDKKFWSGGH CYTLSEINAE ISNKYLYYFM KFSENLIMSL RVGSGLPNIQ 
KKDLEKFNVA FPEINQQYQI SKFLDLLTEK IQVEKSLKTS LIRQKQYVLK KMFI