Gene Cthe_0022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0022
Symbol
ID	4808787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	28483
End bp	29649
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	44%
IMG OID	640105432
Product	2-amino-3-ketobutyrate coenzyme A ligase
Protein accession	YP_001036457
Protein GI	125972547
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0156] 7-keto-8-aminopelargonate synthetase and related enzymes
TIGRFAM ID	[TIGR00858] 8-amino-7-oxononanoate synthase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0282575
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATGATT TTCAAGGTGC TTTGAAAGAT ATAAAAAACA AGGGATTATA CAGGGAGTTT 
CGAAATGTTA ATGCTGCCCA GGGCCCGTAT ACCGTTATTG ACGGAAGAAA AATGCTTATG 
ATGTCATCAA ATAATTACCT GGGCTTGTGT GATGATATAA GGCTTAAAAG AGCTGCGATA 
GAATCTATTC GTAAATTTGG TGTGGGAGCC GGAGGCTCAA GGCTGACTTG CGGAAACTTT 
GAGCTTCACA GGGAGCTGGA GGAGAGGCTT GCAAAATTTA AGGATGTGGA AAGCTGTATT 
GTTTTTGGAA GCGGATATGC CGCAAATATA GGAGCAATAT CGGGAATTGC GGACAAAAAC 
TGGGTCATAT TCTGCGACCG TCTGAACCAT GCCAGCATTG TGGACGGCAT TCGCCTAAGC 
GGTGCAAAAC TTGTGGTGTA TAAACACTGC GACATGGAGG ACCTTGAAAG CAAGATTGTA 
CGCTATCATA CCGGCAAAAG CCTTATAGTA ACGGATGGCG TGTTCAGCAT GGACGGGGAT 
GTGGCACCGG TGGATAGGAT TGTGAAGTTG GCTAAAAAAT ACAATCTTAT GACAATGGTG 
GATGATGCCC ATGCCACAGG AATTTTGGGA GAAAAGGGAA GGGGGACGTC GGAGTACTTT 
GGCCTTAAAG ATGCTGTTGA TATAAGCATG GGTACTTTGA GCAAGGCTTT TGGTGTTGAA 
GGGGGATTTG TTGCAGGAAA GAGAAAGCTT GTTGATTTTT TACGGCACAA GGCCAAAAGC 
TTTATTTACT CTACTGCTCC GCCGCCTCAT AATATGGCTG CGGCGTTAGA AGCTTTGAAT 
ATCATAGAAA CGGAGCCGCA GGCAAGAAAG GAATTGGCTG AAAAATCCGT GTGGCTAAGA 
AACAGGCTTA TAGAAAAAGG TTTTAACGTG CCCAAAGGGG TGACGCCGAT AATACCGCTT 
ATGGTGGGAG ATGTAAATAC TGCAGTAGAG TTTAGTATGC TGCTTTATAA CGAAGGGATA 
TATATTCCTG CCATCAGGCC GCCAACAGTT CCTAAAGGAA CGAGCAGGCT TAGAATTTCC 
ATAATGGCTT CCCATTCCTA TGAAGACATG GAGTTTGCCC TTAAAAACCT TGTCCGGTTC 
GGAAGGAAGT TGGGGATAAT ACCATAA

Protein sequence

MYDFQGALKD IKNKGLYREF RNVNAAQGPY TVIDGRKMLM MSSNNYLGLC DDIRLKRAAI 
ESIRKFGVGA GGSRLTCGNF ELHRELEERL AKFKDVESCI VFGSGYAANI GAISGIADKN 
WVIFCDRLNH ASIVDGIRLS GAKLVVYKHC DMEDLESKIV RYHTGKSLIV TDGVFSMDGD 
VAPVDRIVKL AKKYNLMTMV DDAHATGILG EKGRGTSEYF GLKDAVDISM GTLSKAFGVE 
GGFVAGKRKL VDFLRHKAKS FIYSTAPPPH NMAAALEALN IIETEPQARK ELAEKSVWLR 
NRLIEKGFNV PKGVTPIIPL MVGDVNTAVE FSMLLYNEGI YIPAIRPPTV PKGTSRLRIS 
IMASHSYEDM EFALKNLVRF GRKLGIIP