Gene Cthe_2355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2355
Symbol
ID	4808989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2808454
End bp	2810052
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	42%
IMG OID	640107762
Product	L-aspartate oxidase
Protein accession	YP_001038750
Protein GI	125974840
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0029] Aspartate oxidase
TIGRFAM ID	[TIGR00551] L-aspartate oxidase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.730681
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGATGAGA ACAGATATTT GGTGGATTTT GACACAGATG AGCTGCCTAC GGAGTTTCAT 
GATGTTATTA TAATAGGCAG CGGAATAGCA GGAGTTTACA CTGCGCTTGA AATACCTGAA 
AAATACGATG TTGTCATACT CACAAAGGAA ACCATTGAAA TAAGCAACTC GGTTCTTGCC 
CAGGGAGGAA TAGCCGTTTC CCTTGACAAA GGTGATTCTC CGGAGTTGCA TTTTAAGGAT 
ACAATTTATG CCGGAGCAGG CCTGTGTGAC GAGGAAAGTG TGTGGGTTTT GGTTAACGAG 
GCTGCGGCAA ATATTGAAAC TTTGTGCCAA TTTGGAGTCA ATTTCGACAG AAAAAGCAAT 
GACGAGCTTG CCCTCTCGAG GGAAGGGGCT CACAGCAAAA ACAGGATTAT ACATGCCGGG 
GATACAACAG GCAAGGAAGT TTGCGACAAG CTCATATCGG TGGTGAGAAC GAAACAGAAC 
GTTAAAATAA AGGAAAGAGT TGCCGCGATA GATTTAATTA CCGAAGACAA TGTGTGCAAA 
GGCATACTGG CCTATCATGA GGATAGTTCT TCCTATGTGT TTTACAGAGC AAATGTTGTG 
GTGTGTGCAA CAGGAGGATA CGGGCAGTTG TACTCCAACA CAACAAATCC CGAAGTGGCA 
ACGGGGGACG GGGCCGGTCT TGCCTACAGG GCCGGTGCGG AGCTCATGGA TTTGGAGTTT 
GTGCAATTTC ATCCCACGGT TCTTTTCCAC CCCGAGAACA AAAGCTTTCT TATTTCCGAG 
GCGGTAAGAG GGGAAGGTGC CATATTAAGA AATATTAAAG GCGAAAGGTT TATGCCCAAA 
TATCATGAGC TTAAAGAGCT AGCACCCAGA GACATAGTTT CAAGATCCAT TTTTCATGAA 
ATGCAAAAAA CAAATTCAAA CCATGTATAT CTGGATATCA CATTCAAAGG AAAGGAATAT 
TTGGAAAACA GGTTTCCCAA TATTTACAAC ACATGCTTAA GTTACGGCAT AGATATGTCC 
AAAGATTATA TTCCCGTTGC TCCGGCTGAA CATTACTGTA TGGGCGGAAT AAGGACGGAT 
GTGTTTGGAC GCACAAATAT AAAAGGTTTC TATGCCTGCG GTGAAGTTGC ATGCAATGGA 
ATACACGGTG CAAACAGGCT GGCCAGCAAT TCGCTTCTTG AAGGTTTGGT GTTTGGCCGC 
AAGATAGGCA AAGAGGTGGA AAATGTAATT GAAGGCAGCC GAAAAGAGCC TCAAAAAGTC 
AGTATCAAAG TGAAGTCAAA CAGGGTGGAA AAAAATATAG ATGTAAATAA AATTAAAAAG 
GATATCCAGG AAACAATGAC CCGCTATGTT GGAATAGTAA GAGACAGGGA AGGACTTGAA 
AAAGCAAAGA AAAAGGTTGA TGATTACTAC GAATTGATAA AAGATATGAA AAATAACAGC 
GTAAGCGACT TTGAAATGCA AAACATTGTT CTTGTTTCAA AGCTTGTCAT TGAAGCGGCT 
TTGGAACGCA AAGAAAGCCG TGGGGCGCAT TTTAGACTGG ATTATCAAAA AACTGACGAT 
GAAAATTGGA AAAGAAACAT AATAAAAAGA AAAATTTAG

Protein sequence

MDENRYLVDF DTDELPTEFH DVIIIGSGIA GVYTALEIPE KYDVVILTKE TIEISNSVLA 
QGGIAVSLDK GDSPELHFKD TIYAGAGLCD EESVWVLVNE AAANIETLCQ FGVNFDRKSN 
DELALSREGA HSKNRIIHAG DTTGKEVCDK LISVVRTKQN VKIKERVAAI DLITEDNVCK 
GILAYHEDSS SYVFYRANVV VCATGGYGQL YSNTTNPEVA TGDGAGLAYR AGAELMDLEF 
VQFHPTVLFH PENKSFLISE AVRGEGAILR NIKGERFMPK YHELKELAPR DIVSRSIFHE 
MQKTNSNHVY LDITFKGKEY LENRFPNIYN TCLSYGIDMS KDYIPVAPAE HYCMGGIRTD 
VFGRTNIKGF YACGEVACNG IHGANRLASN SLLEGLVFGR KIGKEVENVI EGSRKEPQKV 
SIKVKSNRVE KNIDVNKIKK DIQETMTRYV GIVRDREGLE KAKKKVDDYY ELIKDMKNNS 
VSDFEMQNIV LVSKLVIEAA LERKESRGAH FRLDYQKTDD ENWKRNIIKR KI