Gene Cthe_1031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1031
Symbol	gatB
ID	4811325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1233155
End bp	1234588
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	42%
IMG OID	640106449
Product	aspartyl/glutamyl-tRNA amidotransferase subunit B
Protein accession	YP_001037456
Protein GI	125973546
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0064] Asp-tRNAAsn/Glu-tRNAGln amidotransferase B subunit (PET112 homolog)
TIGRFAM ID	[TIGR00133] glutamyl-tRNA(Gln) and/or aspartyl-tRNA(Asn) amidotransferase, B subunit

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0403261
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGTATG AAATAATTGT AGGGTTGGAG GTTCATGTTG AGCTTTCAAC CAAATCAAAA 
ATATATTGTT CATGCACCAC GGATTTCGGA GGAGAGCCAA ATACCCACAT TTGTCCTGTC 
TGCACCGGTA TGCCGGGAGT GCTTCCGGTT TTGAACAAAA AAGTGGTGGA ATACGCGGTA 
AAAACCGGGC TTGCCACAAA CTGCAGCATT GCAAAGTACA GCAAGCAGGA CAGGAAAAAC 
TATTTTTATC CCGACCTTCC AAAAGCTTAT CAAATTTCCC AGTACGACCT TCCCCTATGC 
CGGGACGGAT ATATTGACAT TGAGGTGGAA GGAAGGACAA AAAGGATTGG GATTACAAGG 
ATACATATTG AGGAAGATGC GGGAAAGCTT GTACATGATC AGAATGAAAC GGGAACGTTG 
ATTGATTATA ACCGGTGCGG TGTGCCGTTA ATTGAGATTG TCACCGAGCC TGACATGCGT 
TCGGCGCAGG AAGCGAGGGC TTTTGTGGAA AGCCTTAGGA ACATACTACG GTACATTGAT 
GTTTCCGACT GCAAAATGCA GGAAGGTTCA TTGAGAGTTG ACGTTAATCT TTCGGTAAGA 
CCTAAGGGCC AAAAGGAATT TGGGACGAGG ACGGAAATGA AAAATTTAAA TTCCATAAGG 
TCAATGGTAA GGGCAATTGA AAGTGAAGCC AAAAGACAGA TTGAGGTTAT TGAAAGTGGC 
GGAATTATTG TTCAGGAAAC CAGGAGATGG GATGAACACA AAGGTGTAAG CTGTTCAATG 
AGAACTAAAG AGGAGGCCCA CGATTATCGA TATTTTCCGG AACCGGATCT TATGCCGATA 
GTGGTGGATG AAGAATGGAA GGAAGAAATA AAAAGAAGTC TTCCCGAGCT TCCTGATGCA 
AGAAGAAAAA GGTATGTAAA CGAGTATGGA CTTCCCGGAC ATGATGCTTT CATTCTTACA 
AGCTCAAAGG CTCTTGCAGA TTTTTTTGAG GAGGCGGCGG GAAAATGCAA TAATGCAAAA 
GCCGTGAGTA ATTTTATACT GGGGGATGTT TCGAGAATCC TTAACGACAA GGGAATGGAA 
GCTGAAGACA TACCTTTTCC GGCGGAATAC CTGGCAAAGT TGGTGAAATT GGTTGACCAG 
GGAACAATAA GCACAACCAT TGCAAAAAAA GTATTGGAGA TAATGTTTGA ACAAAAAAAG 
GATCCGCAGG AGATAGTAAG GGAAGAAGGA CTTGAAGTTG TAAGTGATGA AAAAGCTCTT 
GCCGAGGTTG TTAAAAAGGT GATTTCAAAC AATACAAAAT TGGTGGAGGA TTACAAAAAA 
GGCAAGGACA AAGTTTTCGG ATTCCTTGTG GGACAGGCTA TGAAAGAGAC TAAGGGGAAA 
GCAAATCCCC GGCTTTTAAA CAAGATTTTG AAAGAAGAAC TTGACAAAAT ATAA

Protein sequence

MEYEIIVGLE VHVELSTKSK IYCSCTTDFG GEPNTHICPV CTGMPGVLPV LNKKVVEYAV 
KTGLATNCSI AKYSKQDRKN YFYPDLPKAY QISQYDLPLC RDGYIDIEVE GRTKRIGITR 
IHIEEDAGKL VHDQNETGTL IDYNRCGVPL IEIVTEPDMR SAQEARAFVE SLRNILRYID 
VSDCKMQEGS LRVDVNLSVR PKGQKEFGTR TEMKNLNSIR SMVRAIESEA KRQIEVIESG 
GIIVQETRRW DEHKGVSCSM RTKEEAHDYR YFPEPDLMPI VVDEEWKEEI KRSLPELPDA 
RRKRYVNEYG LPGHDAFILT SSKALADFFE EAAGKCNNAK AVSNFILGDV SRILNDKGME 
AEDIPFPAEY LAKLVKLVDQ GTISTTIAKK VLEIMFEQKK DPQEIVREEG LEVVSDEKAL 
AEVVKKVISN NTKLVEDYKK GKDKVFGFLV GQAMKETKGK ANPRLLNKIL KEELDKI