Gene Ccel_3218 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_3218
Symbol
ID	7311800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	3753825
End bp	3755009
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	44%
IMG OID	643610120
Product	tryptophan synthase subunit beta
Protein accession	YP_002507488
Protein GI	220930579
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAAAAG GCAGATATGG AAAGCATGGG GGGCAATATA TCCCTGAAAT ATTAATGAAC 
ACCATAAATG AACTTGAAGA GAGTTATAAC TATTATAGAA ATGATTTTGA CTTCAACAGG 
GAGCTTAATA CCTTATTGAA GGAATACGCA GGAAGGCCCT CCCTGTTATA TTTCGCAAAA 
AAAATGACAG AGGATTTGGG TGGTGCAAAA ATATATCTAA AGCGTGAAGA CCTGAATCAC 
ACAGGTTCCC ACAAGATAAA CAATGTTCTG GGACAGGTGC TTCTGGCAAA GAAAATGGGC 
AAAAAGCGTG TCATAGCCGA GACAGGTGCT GGACAGCACG GTGTGGCTAC TGCAACCGCT 
GCGGCACTTA TGGGTCTTGA TTGCGAAATT TTTATGGGTC TGGAGGATAC TAAGCGTCAG 
GCGTTAAATG TTTTCAGAAT GGAGCTGCTG GGTGCAAAAG TCCACCCGGT TACAAGCGGA 
ACACAAACCT TGAAGGACGC AGTTAATGAG ACTTTCCGTG AGTGGGCTTC AAGAATGGAT 
GACACCGCCT ATGTACTGGG TTCTGTTATG GGGCCTCATC CATTTCCTAC GATTGTAAGA 
GATTTCCAGA GTGTTATTGG TAAGGAAGTC AGGGAACAGA TGTTGGAGAA AGAAGGCAGG 
CTCCCGGATG TTGCCATGGC TTGCGTTGGC GGCGGCAGTA ATGCTATGGG ACTTTTTTAT 
GACTTTATAG GCGACAAATC CGTTGAGCTG ATAGGATGTG AAGCCGCCGG AAAAGGTGTA 
GATACTGAAT TGCATGCAGC TACTATAGCA AAAGGACAGC TTGGAATATT CCACGGTATG 
AAATCGTATT TTTGTCAGGA CGAATACGGA CAAATTGCTC CCGTTTACTC TATTTCGGCA 
GGCTTGGATT ACCCCGGAAT AGGTCCCGAA CATGCAAACC TCCATGACAC GAGCCGTGCT 
AAATATGTCC CCATAACTGA TGCAGAGGCG GTTACAGCCT TTGAATATCT TTCACGTACC 
GAAGGTATCA TTCCGGCAAT TGAAAGCTCC CATGCAGTTG CACATGCCAT GAAAATTGCA 
CCTAAAATGG AAAATGACAA AATAATAGTT ATTTGCCTTT CAGGAAGAGG AGATAAGGAT 
GTTGCTGCTA TTGCAAAATA TATGGGGGTG AATATTGATG AGTAA

Protein sequence

MIKGRYGKHG GQYIPEILMN TINELEESYN YYRNDFDFNR ELNTLLKEYA GRPSLLYFAK 
KMTEDLGGAK IYLKREDLNH TGSHKINNVL GQVLLAKKMG KKRVIAETGA GQHGVATATA 
AALMGLDCEI FMGLEDTKRQ ALNVFRMELL GAKVHPVTSG TQTLKDAVNE TFREWASRMD 
DTAYVLGSVM GPHPFPTIVR DFQSVIGKEV REQMLEKEGR LPDVAMACVG GGSNAMGLFY 
DFIGDKSVEL IGCEAAGKGV DTELHAATIA KGQLGIFHGM KSYFCQDEYG QIAPVYSISA 
GLDYPGIGPE HANLHDTSRA KYVPITDAEA VTAFEYLSRT EGIIPAIESS HAVAHAMKIA 
PKMENDKIIV ICLSGRGDKD VAAIAKYMGV NIDE