Gene Ccel_3404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_3404
Symbol
ID	7311966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	3952563
End bp	3954167
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	42%
IMG OID	643610308
Product	hypothetical protein
Protein accession	YP_002507672
Protein GI	220930763
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.515631
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGGAA TGCCAATTTA TCAAGATTCT CCGACGAATC TAAAAAATCA GATTTTTGCA 
GCAAACGGAT CATCTGTAGT TAATGTTCAG GCTGACAATA CAGGTAGATT AAAGGTTGCA 
ACCGACAGTT CGTCCCCACT CGCTGTTGAC GTAGATGAAG CTGTAAACAG TATAACTGTT 
TATGGCAGTG ACGGTACAAG TAACCAAGTT TTAAGAACAA CTGCTACGGG TCAGCTGGAT 
ATCAGGCCTC TTACCGTTTC AGATACTGTC AATGTGAGTA TTACTCAAGC AGATGACAGT 
ATTACTGTCT ATGGTAATGA CGGTACTGCA AACCAGATAA TTAAAACTAA CTCCACAGGC 
CAACTGGATA TCAGACCTCT GACTTCTTCT GATACCGTCA GCGTTGATGT TTCCCAAGCT 
ACCGATAGTA TTGCTGTTTA TGGTAATGAC GGTACTGCAA ACCAGATAAT TAAAACTAAC 
TCCACAGGCC AACTGGATAT CAGACCTCTG ACTTCTTCTG ATACCGTCAG CGTTGATGTT 
TCTCAAGCTA CCGATAGTAT TGCTGTTTAT GGTAATGACG GTACTGCAAA CCAGATAATT 
AAAACTAACT CCACAGGCCA ACTGGATATC AGACCTCTGA CTTCTTCTGA TACCGTCAGC 
GTTGATGTTT CTCAAGCTAC CGATAGTATC GCTGTTTATG GTAATGACGG TACTGCAAAC 
CAGATAATTA AAACTAACTC CACAGGCCAA CTGGATATCA GACCTCTGAC TTCTTCTGAT 
ACCGTCAGTG TTGATGTTTC CCAAGCTACC GATAGTATCG CTGTTTATGG TAATGACGGT 
ACTGCAAACC AGATAATTAA AACTAACTCC ACAGGCCAAC TGGATATCAG ACCTCTGACT 
TCTTCTGATA CCGTCAGCGT TGATGTTTCC CAAGCTACCG ATAGTATTGC TGTTTATGGT 
AATGACGGTA CTGCAAACCA GATAATTAAA ACTAACTCCA CAGGCCAACT GGATATCAGA 
CCTCTGACTT CTTCTGATAC CGTCAGCGTT GATGTTTCTC AAGCTACCGA TAGTATCGCT 
GTTTATGGTA ATGACGGTAC TGCCAATCAG ATAATTAAAA CTAACTCCAC AGGCCAACTG 
GATATCAGAC CTCTGACTTC TTCCGATACC GTAAACGTTG ATATTTCTCA ATCTACCGAT 
AGTATTGCTG TATACGGTAG TGACGGTACT GCCAATCACG CTTTATTAAC TGATTCGGCC 
GGAATACTAC AGGTTAACAA TACCCGGACC TTTACAACTG CTACTCTTAC AACTTTAGAA 
ACAACAGACA GCTATCAATA TACAACCCAA CAGGAGATTG CTCAACTGAA CACCTATCAG 
TTCTTTGTAA AGAATACAGG AGATACAAAC AGTGTTACAC TTGTTGTTGA ATTGAGCCCA 
AATGGTACAG ACTGGGTAGT TGACAGTGAC GAACGTCCGA TTACCTTCGG GGCTGCAACA 
ATTATAACTT CGAACAAGTT CCTAAGATAT ATAAGATTAG GATACAAGTC CACAAGTACT 
GGTGCCAGCA CAACTATAAG TGCTATTTTC CAAGGCCAAG GCTAA

Protein sequence

MPGMPIYQDS PTNLKNQIFA ANGSSVVNVQ ADNTGRLKVA TDSSSPLAVD VDEAVNSITV 
YGSDGTSNQV LRTTATGQLD IRPLTVSDTV NVSITQADDS ITVYGNDGTA NQIIKTNSTG 
QLDIRPLTSS DTVSVDVSQA TDSIAVYGND GTANQIIKTN STGQLDIRPL TSSDTVSVDV 
SQATDSIAVY GNDGTANQII KTNSTGQLDI RPLTSSDTVS VDVSQATDSI AVYGNDGTAN 
QIIKTNSTGQ LDIRPLTSSD TVSVDVSQAT DSIAVYGNDG TANQIIKTNS TGQLDIRPLT 
SSDTVSVDVS QATDSIAVYG NDGTANQIIK TNSTGQLDIR PLTSSDTVSV DVSQATDSIA 
VYGNDGTANQ IIKTNSTGQL DIRPLTSSDT VNVDISQSTD SIAVYGSDGT ANHALLTDSA 
GILQVNNTRT FTTATLTTLE TTDSYQYTTQ QEIAQLNTYQ FFVKNTGDTN SVTLVVELSP 
NGTDWVVDSD ERPITFGAAT IITSNKFLRY IRLGYKSTST GASTTISAIF QGQG