Gene CPR_1689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1689
Symbol
ID	4205991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1885716
End bp	1886789
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	29%
IMG OID	642566239
Product	radical SAM domain-containing protein
Protein accession	YP_699004
Protein GI	110803935
COG category	[B] Chromatin structure and dynamics [K] Transcription
COG ID	[COG1243] Histone acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0776794
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAAAA GACACTATAT AATCCCAATT TTTGTTCCTC ATGAAGGATG TCCACATGAT 
TGCGTGTTTT GTAATCAAGG GAAAATAACT GGAGAAAATA AAGAGATTAT ATTAGGACCA 
AAGTACAAGC AAGAAAATAA GGTTAATAGT AATTTTGTAA GAAAGACAAT TGAAGAATAT 
ATAGAAACAA TTGGTGAAGG AGATAGAATA TTAGAGGTTT CTTTCTTTGG AGGAACTTTT 
ACTGCTATTG ATATAAATAA GCAAAGAGAA CTATTAGCTG TTGCAAAAGA ATATAAGGAT 
AAAAAAATTA TAGACTATAT AAGATTGTCT ACTAGACCAG ATTATATTGA TGAGTTTATT 
TTAGATCATT TAAAAAGTTA TAAAGTTGAT ATAATAGAAC TTGGAGTTCA GTCTTTAGAT 
AAGGAAGTGT TGCATAAATC AGGTAGAGGT CATGGTTATG ATGAGGTTCT AAAAGCTTCT 
AAGTTAATTA AAGAATATGG CTTTACTTTA GGTCATCAAA TAATGGTAGG ACTTCCTGAG 
GACACTTTTG AGAAGGATAT AGAAACAACA AGAGAGTCTA TAAAGATGAA ACCTGATATA 
TGTAGAATAT ATCCTGCTCT TATAGTGAAA AACACTCCTA TGGAGGATAT GTACTTAGAG 
GGAACTTATA AACCATATAC TCTAGAAGAG GCTGTATATA TAAGTGCTAA ACTTTATAAG 
ATGTATAAAG AAAATAATAT ACAGGTTATA AGAATTGGTT TGCAGCCTAC AGATAATATA 
GCTTTAGGTA AGGATATTGT AGATGGGCCT TTCCATCCTG CTTTTAGGGA ATTAGTAGAG 
AGTAGTATTA TAAATGAAAA TATATATAAT ATCTTAAAGG ATAAAAGTGG AGAGGTAACT 
ATAAGAATTA GCAATAAATC AGTTTCTAAG CTTTATGCTG ATAAAAAGAG ATACTTCAAT 
GAACTTAAAG ACAAGGCACA AAATTGTAAT TTGAAGATTA AAGTAGATAA TTCTATGGAA 
GTAGATAAAA TAAATATAGA AGTAGAATCG AAAGTATATA AAATAGATTT ATAG

Protein sequence

MGKRHYIIPI FVPHEGCPHD CVFCNQGKIT GENKEIILGP KYKQENKVNS NFVRKTIEEY 
IETIGEGDRI LEVSFFGGTF TAIDINKQRE LLAVAKEYKD KKIIDYIRLS TRPDYIDEFI 
LDHLKSYKVD IIELGVQSLD KEVLHKSGRG HGYDEVLKAS KLIKEYGFTL GHQIMVGLPE 
DTFEKDIETT RESIKMKPDI CRIYPALIVK NTPMEDMYLE GTYKPYTLEE AVYISAKLYK 
MYKENNIQVI RIGLQPTDNI ALGKDIVDGP FHPAFRELVE SSIINENIYN ILKDKSGEVT 
IRISNKSVSK LYADKKRYFN ELKDKAQNCN LKIKVDNSME VDKINIEVES KVYKIDL