Gene CPR_1900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1900
Symbol	hisS
ID	4205504
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2098173
End bp	2099420
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	32%
IMG OID	642566450
Product	histidyl-tRNA synthetase
Protein accession	YP_699210
Protein GI	110802627
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGATAC AAGCTCAAAA GGGTACAAAG GATATGTTAC CTAATGACGC TTATAAATGG 
CATTATATAG AAGAAAAGTT AAGAAAAATA TCAGCTGAAT ATGGAATTAG AGAGATTAGA 
ACTCCTATGT TTGAGGCAAC TGAACTTTTC AAAAGAGGAG TTGGAGAAAC TACTGACGTG 
GTTCAAAAGG AAATGTATAC TTTTGAAGAC AAAGGTGGAA GAAGCATAAC TCTTAAACCA 
GAGGGGACAG CTCCAGCTGT TAGAGCATTT ATTGAAAATA GTTTATATGC TGATGCTCAG 
CCAACAAAAA TGTTCTATTT TACTCCATGC TTTAGATATG AAAAAATGCA AAAAGGAAGA 
TTAAGAGAAT TCCATCAATA TGGAATAGAA GTTTTTGGTT CACAAGAAGC TTCTATTGAT 
GCAGAAATCT TATCTTTAGT TATGAGAGCA TTAACAGAGG ATTTTGGAAT AAAAGGATTA 
AGCTTAAATA TAAACAGTTT AGGATGTCCA AAATGTAGAG CAAAATTCAA TGAAGCTTTA 
AAACAATATT TAAAAGAGAA CTATGATAAT CTTTGTGAAA CTTGTAAAAC AAGATTTGAA 
AAGAATCCTA TGAGAATCAT AGACTGTAAA GAAAAGAGAT GTAAGGAAAT AGTTAAGGAA 
GCTCCTTCAA TACTAGATTA CATCTGCGAA GAGTGCAGTG ATCACTTTAG CAAGTTAAAA 
GCTTACTTAG ATGTTATGGG AATAGAATAT AACATAGATC CACAAATAGT AAGAGGATTA 
GATTACTATA GTAAAACTGT TTTTGAAGTT ATAAAAGATG GATTAACAGT TTGTGGTGGA 
GGAAGATATG ATTATCTAGT AGAAGAAGTA GATGGTCCTA AAACTCCAGC TATGGGATTT 
GGATTAGGTT TAGAAAGACT TCTTTTAATA TTAGATGAAG AAGGAATAGA AATTCCTGAG 
CCTGTTAGAT GCGAAGTTTA TATTGGATCA ATGGGAGATA GGGCTAAGCT TGAAGCTATG 
AAATTAGCAT TTAATCTTAG AAAATCTGGT ATTAAGGCTG AAATAGATCA CTTAGGAAAG 
AGTGTTAAGG CTCAAATGAA GTATGCTAAT AAAATAGGAG CTAAATATAC TTTTGTTATA 
GGTGACTCTG AAATAGAAGA AAACAAAATT AAAATTAAGA GAATGAGCGA TGGAGAACAA 
TTCGAAGTCA GCTTAGATAT AAATGAAATA GTAAATATAG TTAAGTAG

Protein sequence

MAIQAQKGTK DMLPNDAYKW HYIEEKLRKI SAEYGIREIR TPMFEATELF KRGVGETTDV 
VQKEMYTFED KGGRSITLKP EGTAPAVRAF IENSLYADAQ PTKMFYFTPC FRYEKMQKGR 
LREFHQYGIE VFGSQEASID AEILSLVMRA LTEDFGIKGL SLNINSLGCP KCRAKFNEAL 
KQYLKENYDN LCETCKTRFE KNPMRIIDCK EKRCKEIVKE APSILDYICE ECSDHFSKLK 
AYLDVMGIEY NIDPQIVRGL DYYSKTVFEV IKDGLTVCGG GRYDYLVEEV DGPKTPAMGF 
GLGLERLLLI LDEEGIEIPE PVRCEVYIGS MGDRAKLEAM KLAFNLRKSG IKAEIDHLGK 
SVKAQMKYAN KIGAKYTFVI GDSEIEENKI KIKRMSDGEQ FEVSLDINEI VNIVK