Gene Ccel_3000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_3000
Symbol
ID	7312434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	3551485
End bp	3552525
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	38%
IMG OID	643609904
Product	transcriptional regulator, LacI family
Protein accession	YP_002507274
Protein GI	220930365
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0114429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAAAA AAGTAACAAT GGATGATATT GCAGAGAAGC TTGGTATATC AAAAAATACA 
GTATCTCTAG CACTAAGAGG CATGCCTGGT ATAAGCGAAA GTACAAGAAA AGTAATTGAG 
CAGACTGCAA GGGAAATGGG CTACACGTAT AAAGTGTCAG CACGTAAAAA CACTATGGCA 
CGAAATCTTT GTCTCATTAT TGCAAAAAGC ACACGTGATT CCATAGGTTT CTTTAGTTAT 
GTACAGTTAG GAATAGAAGA TGAAGCAAAG AAAAATAACT TAAACACAAT AATACACTAT 
TACGACGAAA ACGTTCAAGG GTTTGAGACT CCCAACTGCG TAAAGGATGG TATGGTTTCA 
GGAATAATTA CTCTGGGAAG AATTTCTCGT GAAACAATTA ACTGCATAGT AGGATATAAC 
CTTCCTGTTG TTATGGTAGA CAACTATTTC GATAACCTAT CCATGGATTA TATACTCACG 
GACAACCATT CAGGCGGATA TGCTGCTACG GAGTATCTTA TAGACTGCGG ACATACCAAA 
ATAGGATTTT TAGGTGATAT CTCCGCATCA ATAAGCTTTT ATGACAGGTA TCAGGGGTTT 
TTAAAAGCTC TAAGAGATCG GGGAATTGAA ATTAACGAAG GTTATTCGAT AACTGATAAA 
AAGCTTGAAG AATTGCCTCA AGAAGATATA ACTGGGCTAG TCAACGAAAT CAGAACCAAG 
GCAGGCCTCC CAACCGCTTT TTTTTGCTGC AATGATGCGG AGGCTATTGT AATTATAAAA 
GTGCTGAAAA ACATAGGTGT ATTAGTACCG AATAAAATTT CAATCATAGG CTTTGACGAT 
ATAGAAAATG CCGCAAATGT TACCCCTGAA TTAACTACAA TGAGAGTGCA GAAGGAGATT 
ATGGGTAAAG GAGCAGTTTG CAAGCTTATG GAAAAATTGG AACAAGAAAT TAAGTCCTCT 
GAAAAGATAT TGCTGTCAGC CTGTCTTATC AAAAGAAATT CGGTTAATCG TTCGGATATG 
GCGTTTCATG GCTCGTGCTG A

Protein sequence

MSKKVTMDDI AEKLGISKNT VSLALRGMPG ISESTRKVIE QTAREMGYTY KVSARKNTMA 
RNLCLIIAKS TRDSIGFFSY VQLGIEDEAK KNNLNTIIHY YDENVQGFET PNCVKDGMVS 
GIITLGRISR ETINCIVGYN LPVVMVDNYF DNLSMDYILT DNHSGGYAAT EYLIDCGHTK 
IGFLGDISAS ISFYDRYQGF LKALRDRGIE INEGYSITDK KLEELPQEDI TGLVNEIRTK 
AGLPTAFFCC NDAEAIVIIK VLKNIGVLVP NKISIIGFDD IENAANVTPE LTTMRVQKEI 
MGKGAVCKLM EKLEQEIKSS EKILLSACLI KRNSVNRSDM AFHGSC