Gene Cthe_1331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1331
Symbol	aspS
ID	4809471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1619327
End bp	1621114
Gene Length	1788 bp
Protein Length	595 aa
Translation table	11
GC content	45%
IMG OID	640106755
Product	aspartyl-tRNA synthetase
Protein accession	YP_001037756
Protein GI	125973846
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0173] Aspartyl-tRNA synthetase
TIGRFAM ID	[TIGR00459] aspartyl-tRNA synthetase, bacterial type

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.175841
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAGAAT CTATTTATGG ATTGAAAAGG ACGCATATGT GCGCCGAACT TACCGTGAAT 
GATGTCGGAA AGACCGTTAC GGTTATGGGA TGGTGCCACA AAAGCAGGAA TCTTGGTGGG 
TTAATTTTTG TTACATTAAG AGACAGAACC GGTATAATCC AGGTAGTGTT TGACAACACG 
GTAAATTCCG AACTTTTTGC AAAAGCTGAG GGAATCAGAG GCGAATACGT GCTTGCCGTG 
GTGGGAGAAG TGGTGAAAAG AAGCCCCGAG GCAATAAATC CCAAACTTCC CACAGGAGAA 
ATTGAGATTA TTGCAAAGGA ATTGAGAATT CTCAGTACTG CCGAGTCACC ACCCATATAT 
ATTGAAGAGG ATTCCGATGT AAACGAGGCC ACAAGGCTTA AGTACAGATA TCTTGATTTG 
AGAAGACCTG ACATGCAGAG AAACCTGATG TTAAGGCACA GGGTGGCAAA GATTGCCAGA 
GACTATTTTG ACGAGCACGG TTTTATTGAA ATAGAGACTC CGATGCTTAC CAAGAGCACT 
CCCGAGGGGG CAAGAGACTA TCTTGTGCCA AGCAGGGTAC ATCCGGGGAA ATTTTTTGCG 
CTGCCCCAGT CACCCCAGCT TTTCAAGCAG CTTTTGATGG TTGCAGGTTT TGACCGGTAT 
ATGCAGATTG TAAAATGCTT CAGGGATGAG GACCTTAGAG CCGACAGGCA GCCTGAGTTT 
ACACAGATAG ATTTGGAAAT GTCATTTGTA AATGTTGAGG ATGTGCTTAC CATAAATGAA 
GGTTTTATAA AAAGGGTATT CAAGGAGGCT ATTAATGTCG ACCTTGAGAT ACCTTTCATA 
AGGATGCCGT ATAAAGAGGC CATGGAGAGA TTTGGGACCG ACAAACCGGA TATAAGGTTT 
GGATTTGAAC TGGTTAACCT GTCAGACCTT GTGGAAAACT GTGGCTTTAA GGTATTTTCC 
GATGCCGTCA AAAACGGAGG AAGCGTTCGG GCGATAAATG CCAAAGGATG TGGAAATAAA 
TTCAGCAGAA AGGAAATAGA TGCCCTTGGT GAATTCGTAA AAACCTATGG TGCAAAGGGA 
ATGGCCTGGA TAGTTGTGGG AGAAAACGAG CATAAATCCC CGATTACCAA ATTCTTTACC 
GAGGACGAAA TCAAGGCCGT TTTGACAAGA ATGCGGGCAG AACCCGGAGA CCTCATATGC 
TTTATTGCCG ACAAAAATGA GGTTGTGTTC GATTCACTGG GACAGCTGAG AGTGGAAATA 
GCAAGAAAGC TGGGATTGCT TGACAACAAG GAATTTAAAT TCCTGTGGGT GACCGAGTTC 
CCGCTCCTTG AATATGACGA GGAGGAAAAA CGCTATGTGG CAAAACACCA TCCTTTTACG 
TCTCCGATGG ATGAGGATGT TGAATTGCTG GATACCGACC CGCTGAAAGT TAGGGCAAAA 
GCTTATGACA TCGTGCTAAA CGGTACGGAA ATCGGAGGAG GAAGCATCAG AATTCACAGT 
CAGGAGCTTC AGTCGAAAAT GTTCAAACTT CTTGGCTTTA GTGAGAAAGA TGCCTGGGAC 
AGGTTCGGAT TCCTTCTTGA GGCTTTCAAA TACGGAACGC CTCCCCACGG CGGAATGGCA 
TTCGGACTCG ACAGATTGGT AATGCTTATG GCCGGAAGAA ACAGCATCAG GGATGTTATT 
GCATTCCCCA AAGTACAGAA TTCATCATGT CTTATGACAA ATGCGCCGGA TGAGGTTGAG 
CCAAAACAGC TTGAGGAGCT TAAAATAAGG GTGGATTTGC AAAATTGA

Protein sequence

MGESIYGLKR THMCAELTVN DVGKTVTVMG WCHKSRNLGG LIFVTLRDRT GIIQVVFDNT 
VNSELFAKAE GIRGEYVLAV VGEVVKRSPE AINPKLPTGE IEIIAKELRI LSTAESPPIY 
IEEDSDVNEA TRLKYRYLDL RRPDMQRNLM LRHRVAKIAR DYFDEHGFIE IETPMLTKST 
PEGARDYLVP SRVHPGKFFA LPQSPQLFKQ LLMVAGFDRY MQIVKCFRDE DLRADRQPEF 
TQIDLEMSFV NVEDVLTINE GFIKRVFKEA INVDLEIPFI RMPYKEAMER FGTDKPDIRF 
GFELVNLSDL VENCGFKVFS DAVKNGGSVR AINAKGCGNK FSRKEIDALG EFVKTYGAKG 
MAWIVVGENE HKSPITKFFT EDEIKAVLTR MRAEPGDLIC FIADKNEVVF DSLGQLRVEI 
ARKLGLLDNK EFKFLWVTEF PLLEYDEEEK RYVAKHHPFT SPMDEDVELL DTDPLKVRAK 
AYDIVLNGTE IGGGSIRIHS QELQSKMFKL LGFSEKDAWD RFGFLLEAFK YGTPPHGGMA 
FGLDRLVMLM AGRNSIRDVI AFPKVQNSSC LMTNAPDEVE PKQLEELKIR VDLQN