Gene Ccel_1807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1807
Symbol
ID	7310538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2160862
End bp	2162874
Gene Length	2013 bp
Protein Length	670 aa
Translation table	11
GC content	35%
IMG OID	643608739
Product	sulfatase
Protein accession	YP_002506137
Protein GI	220929228
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1368] Phosphoglycerol transferase and related proteins, alkaline phosphatase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0290811
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACATGG ATAAAAAAAT AGGCCTTTTT CAAAGGTATG GTTCTATACT GTTTTTTCCT 
ATAACTATAA TATATCTTGA ATCGATATTT AAAATAGTGG TATTTAAAGA ACTATTCAAC 
ATCGGTATAG TATATATGAT ATTATTTTCG ATTCCGGCTG GGATATTATT ATATTTAGTA 
AGCAATTTGT TCAGCAGTAG GGTAAACAGA ACTATATCCA TAGTTCTTAC TGTTTTTCTG 
ACATTTATAT TCATAGTACA AATTGTTTAT TTCCATATAT TTAAAACATT TCTTGCTATA 
TATTCAATAA ATGGAACCGG CCAGGTTCTT CAGTTTTGGC AGGAAGTGCT TTCAGCAGTC 
AAAAGTAAAG CAGCAGTTAT CTTATTACTG TTGGTACCTT TATTACTGAT TATATCCGGT 
AAAAGAGTTT TATTTGTCAA AAAGGTCTCT ATTAAAACCA AAGCATGGCT TGCATTTACA 
ATGGTGTGTA TACAAATAAC AGCCACAATT TTAGTATTTG CTTCAGGCAC AGGTGAGCTT 
AGTACCGGCT TCATTTATTC AAAGGCTGTA ATACCTGACT TATCTATGAA CAGATTCGGT 
ATGCTTACAA CTTCACGGTT GGATGTCAAG CATCTTGTTT TTAGGGTTAA CAGCCCTCGT 
ACTGAGGAGA AAGAAGAAAT AACCGCTATT GCTGACAATA CGGAAATTTT AAACAAACCA 
CAGCCGGAAA AGACAGTAGA AACGCAAGAT TTGCAAAAGC CCGAGATAAA TAATGATGAC 
AATATAATGA ACATCGATTT TGACAAACTT ATAGCAAGTG AAAGTGACCC GAATATTGTT 
TCAATGCATA GGTATTTTAA ATCTGTCAAA CCAACGAAAA AGAACAACTA TACAGGAATG 
TTCAAGGATA AAAACCTTAT AATGATAACA GCTGAGGGCT TTTCACCGTA TGCAGTAAAC 
AAGGATTTAA CACCTACATT GTATAAAATG TATCAGGAAG GCTTCAGATT TACCAACTTT 
TATACGCCTA TGTGGGGTGT GAGTACATCT GATGGTGAAT ACGTTGCGTG TAATTCGTTA 
ATACCAAAAT CTGGAATTTG GAGCTTTTAT ATTTCGGGAA AAAACTATAT GCCGTTCTGT 
ATGGGAAACC AGCTTAAAAA GCTTGGATAT GGTACACGTG CATACCATGA CCACTCTTAT 
ACGTATTATC ACAGGGATGT ATCCCACCCG AACATGGGGT ACGATTTTAA GGCAGTTGGT 
AACGGTCTTA ATATAAAGAA ATCTTGGCCG GAATCAGACC TTGAAATGAT TCAAAAAACT 
GCTGATGAAT ATATGGGAAA AACACCGTTT CATACATACT ATATGACTGT GAGCGGACAC 
TTGATGTATA CTTTTAACGG AAATGCGATG TCGGCAAAAA ACAGAGAGCT AGTAAAAAAC 
TTACCATATT CATCTGGAGT AAAAGCTTAC CTTGCATGCA ATATAGAATT TGACAGAGCT 
ATGGGAGAGT TAATCGCCCT TCTCGAACAA TCAGGTATTG CAGATGATAC ACTGATTGCA 
ATAAGCCCTG ATCACTACCC TTACGGACTT ACAAATAAAG AAATAAGCGA ACTTGCAGGA 
CACCAGATAG AGACAAACTT TGAACTTTAC AAGGGAATAT TTATACTATG GTCAAAAGGA 
ATTAAATCCG AAGAGATAAG TAAACCATGT GCAAGCATGG ATATACTGCC TACAATATCA 
AACCTGATGG GTGTTGAATA TGACTCCAGA TTACTAATGG GGAGAGATAT TTTTTCTGAC 
GCTCCGCCGC TGGTCGTATT CTCAAACTGG AGCTGGCTAA CTGACAAAGC ACGATACAAT 
TCAAAGAACG GTAAATTTCT TCTTGCAGAA GGAGAAACAA ATGAATCTGT CAATAAACAA 
TACAGGACTG AGATTTCCAA ACGTGTAAAT GACATGTTTA CCTATTCGGA AAAGATATTG 
GAGAATAATT ATTATAAAAA AGTTATCAGA TAG

Protein sequence

MYMDKKIGLF QRYGSILFFP ITIIYLESIF KIVVFKELFN IGIVYMILFS IPAGILLYLV 
SNLFSSRVNR TISIVLTVFL TFIFIVQIVY FHIFKTFLAI YSINGTGQVL QFWQEVLSAV 
KSKAAVILLL LVPLLLIISG KRVLFVKKVS IKTKAWLAFT MVCIQITATI LVFASGTGEL 
STGFIYSKAV IPDLSMNRFG MLTTSRLDVK HLVFRVNSPR TEEKEEITAI ADNTEILNKP 
QPEKTVETQD LQKPEINNDD NIMNIDFDKL IASESDPNIV SMHRYFKSVK PTKKNNYTGM 
FKDKNLIMIT AEGFSPYAVN KDLTPTLYKM YQEGFRFTNF YTPMWGVSTS DGEYVACNSL 
IPKSGIWSFY ISGKNYMPFC MGNQLKKLGY GTRAYHDHSY TYYHRDVSHP NMGYDFKAVG 
NGLNIKKSWP ESDLEMIQKT ADEYMGKTPF HTYYMTVSGH LMYTFNGNAM SAKNRELVKN 
LPYSSGVKAY LACNIEFDRA MGELIALLEQ SGIADDTLIA ISPDHYPYGL TNKEISELAG 
HQIETNFELY KGIFILWSKG IKSEEISKPC ASMDILPTIS NLMGVEYDSR LLMGRDIFSD 
APPLVVFSNW SWLTDKARYN SKNGKFLLAE GETNESVNKQ YRTEISKRVN DMFTYSEKIL 
ENNYYKKVIR