Gene Ccel_2427 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2427
Symbol
ID	7311099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2927215
End bp	2928393
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	43%
IMG OID	643609358
Product	chorismate synthase
Protein accession	YP_002506737
Protein GI	220929828
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00147882
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAGGAA ATACATTTGG CAGATTATTC AGGGTTACAA CATGCGGAGA ATCCTATTCG 
GGAGCTTTTA GGAAGAATTC AGATATTCCG CCTGAATTGT GGGGCGGACT GGCAGTAATA 
GTTGACGGTG TTCCCGCCGG ACTGAAAGTA ACTTCACAGA TTATACAGGA GGAACTGGAT 
AAAAGAAAAC CTGGACAATC CCGGCTCCAC ACACCCAGAA CTGAAGCGGA TAAGGTCTAT 
ATATTTTCAG GTGTAATGCA GGATGACAGA ACAACAGGAG CACCTGTATG TATGCTGATT 
CCCAGCAGTG ATATTGGGGA TTATCATATA GAACAGCACA AGGGTAATAA GGACTTGTTA 
AGACCCGGAC AGGCAGCGTA TACCTATTAT AAAAAATATG GGGAACATTC TGACTATCTT 
GGAGCAGGAA GGGCCTCGGC GCGTGAAACA GTTGCAAGGG TGGCAGGAGG AGCAATTGCT 
AAAATAATTC TCGATAGTAT GGGGATTGAT GTAATAGCGT TTACGATTGA GTCTCATGGA 
ATAAAAGCAG GACCGTTTTC ATATGAAACG GCCAAACAGA ATTACAGAGC TAATGATATA 
AACTGTCCCG ATTTGGATAT TGCAAAGCAT ATGATTGATG ACTTGCTTCA AGTAAAAAAG 
GAGGGGGATT CCTGCGGAGG TGCAATAGAG ATAATAGCAA AGGGAGTACC TGCGGGACTT 
GGAGAGCCTG TATTCGATAA GTTAAGTGCC ACAATTGCAC ATGGAATTAT GTCTATAGGC 
GGTGTAAAAG GAATTGAGAT AGGAGATGGC TTTGGAGTAA CATCCAAAAA GGGCTCAGAA 
TGTAATGACA CGCCTTATTA CGATGAGGAA ACAAGACGTA TCAGATTTAA AACAAACAGA 
GCGGGCGGTA TGCTTGGAGG AATATCAAAC GGTGAAGAAA TTAGAATTCG TGTTGCTGTC 
AAACCGACAC CAACTATTTT AAAGGATCAG CTGACAGTGA ATGTATCAAC TCTTGAACCG 
GTTACCCATA AATTTGCGTC CAGAAGCGAC CCTTCGCTTG TACCGAGAAT ATACCCTATT 
TGTGAAGCTA TGGTTAGAAT GGCACTGGTA GATAGTATAC TAATGGCTTC AGGTAGCAGG 
AGCATAACAG ATATGGATAA CAGGTGGGAT AAGCTATGA

Protein sequence

MLGNTFGRLF RVTTCGESYS GAFRKNSDIP PELWGGLAVI VDGVPAGLKV TSQIIQEELD 
KRKPGQSRLH TPRTEADKVY IFSGVMQDDR TTGAPVCMLI PSSDIGDYHI EQHKGNKDLL 
RPGQAAYTYY KKYGEHSDYL GAGRASARET VARVAGGAIA KIILDSMGID VIAFTIESHG 
IKAGPFSYET AKQNYRANDI NCPDLDIAKH MIDDLLQVKK EGDSCGGAIE IIAKGVPAGL 
GEPVFDKLSA TIAHGIMSIG GVKGIEIGDG FGVTSKKGSE CNDTPYYDEE TRRIRFKTNR 
AGGMLGGISN GEEIRIRVAV KPTPTILKDQ LTVNVSTLEP VTHKFASRSD PSLVPRIYPI 
CEAMVRMALV DSILMASGSR SITDMDNRWD KL