Gene Ccel_0138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0138
Symbol
ID	7309049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	153543
End bp	154718
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	41%
IMG OID	643607067
Product	malic protein NAD-binding
Protein accession	YP_002504506
Protein GI	220927597
COG category	[C] Energy production and conversion
COG ID	[COG0281] Malic enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000809828
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTAATA TTTATGAGGA TTCACTAAAA GCCCACGAAG AGTGGCAGGG AAAGATAGAA 
GTTGTATGTA AGGCTCCTTT AAAGGACAAA AGAGATCTTT CTTTAGCTTA TTCACCTGGA 
GTAGCTCAAC CATGTCTCGA AATTCAAAAA GACGTTGAGA ACTCTTACAA ATACACCAGA 
AGACACAATC TTGTAGCAGT TGTCACTGAC GGTACTGCTG TACTTGGTTT AGGAGATATC 
GGACCCGAAG CAGGTATGCC TGTTATGGAA GGTAAATGCT GTTTGTTCAA GACTTTTGGT 
GATGTTGATG CATTCCCTCT CTGTATAAAG TCAAAAGATG TTGACACAAT TGTTAACACA 
ATTAAATTGC TTTCAGGAAG CTTTGGCGGC GTAAATCTTG AAGATATAGC TGCTCCAAGA 
TGTTTTGAAA TCGAAGAAAG ATTAAAGAAG GAAACTGATA TTCCTATATT CCACGATGAC 
CAGCATGGAA CAGCTATTGT TACAGCTGCA GGTCTTATCA ATGCTTTAAA GGTTGTTGGT 
AAGAAGATGG AGGATATCTC AATAGTTGTA AACGGTGCTG GTGCTGCTGC TATAGCTATT 
ACAAAACTTC TTTTCTCCAT GGGGCTCAGA AAGGTTGTTC TTTGTGACAC AAAGGGTGCT 
ATCTACGAGG GTAGAGACAA CCTTAATCCG ATAAAGGCTG AAATGGCTAA AATCACTAAT 
CTTGAAGGCA AAAAAGGTTT ATTGAAGGAT GTTATTGTTG GTGCAGACGT ATTTATCGGA 
GTTTCAGCGG CTAACCTAGT AACAAAAGAA ATGGTTAAGT CAATGGCTAA AGACCCGATT 
ATCTTTGCTC AAGCAAACCC AACTCCTGAA ATTCTGCCTG AAGATGCTCT CGAAGCTGGT 
GCTGCTGTTG TTGGGACAGG CCGTTCAGAC TATCCAAATC AGGTTAACAA TGTTCTTGCA 
TTCCCTGGTA TATTCAGAGG AACTTTCGAT GTAGGAGCAC GTGAAATAAA TGATGAAATG 
AAGATAGCTG CTGCATACGC AATCGCAGGA CTTGTTAGCG ATGAAGAAAG AAATGCAGAG 
TATGTAATTC CGGCTCCATT CGATCCTAGA GTAGCAAAAG CAGTTGCAGA AGGTGTTGCT 
GAAGCAGCTA GAAAATCAGG TGTAGCTAGA AGGTAA

Protein sequence

MGNIYEDSLK AHEEWQGKIE VVCKAPLKDK RDLSLAYSPG VAQPCLEIQK DVENSYKYTR 
RHNLVAVVTD GTAVLGLGDI GPEAGMPVME GKCCLFKTFG DVDAFPLCIK SKDVDTIVNT 
IKLLSGSFGG VNLEDIAAPR CFEIEERLKK ETDIPIFHDD QHGTAIVTAA GLINALKVVG 
KKMEDISIVV NGAGAAAIAI TKLLFSMGLR KVVLCDTKGA IYEGRDNLNP IKAEMAKITN 
LEGKKGLLKD VIVGADVFIG VSAANLVTKE MVKSMAKDPI IFAQANPTPE ILPEDALEAG 
AAVVGTGRSD YPNQVNNVLA FPGIFRGTFD VGAREINDEM KIAAAYAIAG LVSDEERNAE 
YVIPAPFDPR VAKAVAEGVA EAARKSGVAR R