Gene Ccel_1045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1045
Symbol
ID	7309867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1300307
End bp	1301557
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	37%
IMG OID	643607972
Product	Radical SAM domain protein
Protein accession	YP_002505387
Protein GI	220928478
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0621] 2-methylthioadenine synthetase
TIGRFAM ID	[TIGR00089] RNA modification enzyme, MiaB family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAA AAGTACGGCT AATATGTAAT TTGAACTGTA GCAGAAGACA GATGGACATG 
GTAAAGCTGG AATCCTATCT TTCTGCAAAC GGCTATGAGG TGGTTGAAGA TGAAAAACAG 
GCGGATCAAA TTGTTTATAC AACATGTGGT TTTATAAATG AAACGGCCCA AGTGGCATTT 
AATGAAATAG AAAGGCTGAA ATCACTGCCT GCTGAGCTTA TTGTTACAGG CTGCCTGCCT 
GATACAGATT CTGAAACGTT CAATAAGATA CATAGCGGTA AAGTAGTCCG CAATACAGAA 
TTATATAAAT TTGACGATGT TTTCGGAGGA GATACTAAAT TTCAGGATAT CCCTGACGCA 
CATGATATGC CATGGGGAAA GGGTGAATAC TTTTGTGTCG AGGTTAGCCG AGGGTGTCCT 
GAAAATTGTT CATATTGTGC AACAAAATGG GCTGTTGGAA AAATGAAGAG TAAGCCTATA 
CAAAAGTGTA TAGAGGAAAT TGAAGAATTC AAAAAAAGTA CGTTTAGTAA GGTCGTAATT 
AATGGTGACA ATGTGGGGGC TTACGGGCTT GATATAAAAG AAACCTTTGG TACATTAGTT 
TCAGCTCTGC CAATAGAGGA TGAAAAATAC AAGGCATATA TTGATTCATT GCATCCAAGA 
TGGCTATTGC TATATTATGA TGCAGTACTG GCGGCAATAA GCAAAAACCG CTTTGGTATG 
CTTGTATCTG CTATACAGGC AGGTAATGAG AGGGTCTTGG AGCTAATGCG GCGTAAAGCA 
GATATGAAAA AATTAAAGGA GGCTTTTATT GAAATAAAGC AAAAAAGCCC GGAAATAGTT 
TTAGGAACTG AAGTTATTGT AGGATTTCCA ACAGAAAGCG AAAGTGACTT TATCGAAAGT 
GTAGATTTTA TTTTAAGTAC AAAATTAGAT TGGGGTAATA TTTTCGCCTT CTCACCGAAA 
AAAGGAACCG AGGCTGCGGC AATCAAAGGT CAGGTTGAAG AAGCCGAAAA AATAAGAAGA 
ATCAATTATC TGGTAGAAAA GCTCAAGGAA AATGGATATT TTATTTTTAA GGAAGAGAAA 
TCACAAGCTG TTATTTTTAG CAATGCCGAT ATTTGCATTA ATGCAGACAA GAGCCCGAAC 
CCATATTGGC AGACCTGTTT TGACACTGTT TGTCTTGACA GAAAGAAACA GAATCAAATT 
CGTAGCGATT TAAGGGAAGG AAAAATAAAA GTCAGTGAAG TAAGTTTCTA A

Protein sequence

MSKKVRLICN LNCSRRQMDM VKLESYLSAN GYEVVEDEKQ ADQIVYTTCG FINETAQVAF 
NEIERLKSLP AELIVTGCLP DTDSETFNKI HSGKVVRNTE LYKFDDVFGG DTKFQDIPDA 
HDMPWGKGEY FCVEVSRGCP ENCSYCATKW AVGKMKSKPI QKCIEEIEEF KKSTFSKVVI 
NGDNVGAYGL DIKETFGTLV SALPIEDEKY KAYIDSLHPR WLLLYYDAVL AAISKNRFGM 
LVSAIQAGNE RVLELMRRKA DMKKLKEAFI EIKQKSPEIV LGTEVIVGFP TESESDFIES 
VDFILSTKLD WGNIFAFSPK KGTEAAAIKG QVEEAEKIRR INYLVEKLKE NGYFIFKEEK 
SQAVIFSNAD ICINADKSPN PYWQTCFDTV CLDRKKQNQI RSDLREGKIK VSEVSF