Gene Cthe_3093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_3093
Symbol
ID	4809967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3646611
End bp	3647885
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	44%
IMG OID	640108516
Product	adenylosuccinate synthetase
Protein accession	YP_001039481
Protein GI	125975571
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0104] Adenylosuccinate synthase
TIGRFAM ID	[TIGR00184] adenylosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000909449
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTACCA GAGTTGTAGT AGGCACCCAG TGGGGAGATG AGGGAAAAGG CAAGTATATT 
GACATGCTGG CCAAAGACTC GGACATGGTG GTGCGATTTT CAGGAGGAAA CAATGCCGGA 
CACACGATAG TGGCCAACGG TGTAAAATAT GCGTTGCATC TTATACCGTC GGGCATATTG 
AATGAAGGCA AAACTTGTAT TATAGGCAAC GGTGTTGTGG TTGATCCGGC AGTTTTGCTA 
AAGGAAATTA AGGAGCTTAA TGAGAAAGGG ATAAGTACTG ACAGGCTTTT GATAAGTGAC 
AGGGCTCATG TTATCATGCC GTACCACAAA CTTTTGGATG AGCTTCAGGA GAAGTTTCGT 
GGAGAGAATT CAATAGGGAC AACCAAAAGA GGAATTGGGC CGTGCTACTC TGACAAGACG 
GAACGATCGG GAATCAGAAT GTGCGACCTT GTTGATGAAG ATGAATTTGT CAGGAAGGTA 
AGAGAAAACT TGAAGGTTAA GAACCTCATA ATTGAAAAGG TATACGGCGG ACAAAAACTG 
GATGAGGAAC AGGTTATATC CGAATATCTT GAATATGGAA GAAAGCTTAA GGAATACGTT 
GCGGATGTAA ACAGCATTAT ATTTGAGGCC ATAGAGCAGG GAAAAAATAT ATTGTTTGAA 
GGAGCCCAGG CAACATTTTT GGATCTTGAT TTCGGAACCT ACCCTTATGT CACTTCTTCC 
AATCCTGTGG CAGGTGGAGT TTGTACAGGT GCAGGAGTCG GACCTGTTTT TATCAATGAG 
GTATATGGGG TTCTGAAAGC CTATACGTCA AGAGTTGGCG CAGGACCGTT CCCGACGGAA 
CAGAACAACG AAATAGGCGA CAGAATAAGA GAACTTGGAT GGGAATATGG CACAACTACG 
GGAAGGCCAA GACGCTGCGG GTGGCTTGAT CTCGTTATGA TAAAGTATGC TGCCAGAGTA 
AACGGACTTA CCGCACTGGC AATAAACCAT GTTGATACAA TAGGAAAGCT GCCAAAAATC 
AAGCTTTGTG TTGCGTATAA AAAGAACGGG CAGGAAACGC GCAATTTCCC GTGCAGCTTA 
AAAGAGCTTG CCCAATGTGA ACCCGTATAT GAGGAATTTG ACGGTTGGGA TGAAGACATA 
TCAAACGTAA AGTCCTTTGA TGATCTTCCT GACAACGCGA AAAAGTATCT GAGCAGAATA 
GAAGAAATTG TCGGAGTAAA AATAAAACTG ATTGGTGTGG GGAAGGAAAG AGAGCAGACT 
ATAGTCGTAA ACTAA

Protein sequence

MATRVVVGTQ WGDEGKGKYI DMLAKDSDMV VRFSGGNNAG HTIVANGVKY ALHLIPSGIL 
NEGKTCIIGN GVVVDPAVLL KEIKELNEKG ISTDRLLISD RAHVIMPYHK LLDELQEKFR 
GENSIGTTKR GIGPCYSDKT ERSGIRMCDL VDEDEFVRKV RENLKVKNLI IEKVYGGQKL 
DEEQVISEYL EYGRKLKEYV ADVNSIIFEA IEQGKNILFE GAQATFLDLD FGTYPYVTSS 
NPVAGGVCTG AGVGPVFINE VYGVLKAYTS RVGAGPFPTE QNNEIGDRIR ELGWEYGTTT 
GRPRRCGWLD LVMIKYAARV NGLTALAINH VDTIGKLPKI KLCVAYKKNG QETRNFPCSL 
KELAQCEPVY EEFDGWDEDI SNVKSFDDLP DNAKKYLSRI EEIVGVKIKL IGVGKEREQT 
IVVN