Gene Cthe_0198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0198
Symbol
ID	4808616
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	240847
End bp	242352
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	44%
IMG OID	640105611
Product	glutamate synthase (NADPH) GltB2 subunit
Protein accession	YP_001036632
Protein GI	125972722
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0069] Glutamate synthase domain 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAATCA ATTTTTTGTA TCCGGAATAT GAAGTTGTAA GAAATATGGA CAGATGCATT 
AACTGCAGGG TTTGCGAAAG ACAGTGCGCC AATGAGGTTC ACAGCTACGA CCAGGAGAAA 
AAAATAATGT GCAGTGATGA TTCCAAATGC GTCAACTGCC ATAGATGTGT GGCTCTTTGT 
CCTACAAGGG CTCTCAAGAT AGTAAAAACG GATCATACGT TTAAAGAAAA TGCTAACTGG 
AGAGGTTCAA TAATTAATGA AATATACAAG CAGGCTGAAA GCGGCGCTGT ACTTTTGTCC 
AGCATGGGAA ATCCCAATGA GTATCCTGTG TATTTTGACA AAATTCTGTT AAATGCCTCC 
CAGGTTACAA ATCCTTCTAT CGACCCGTTG AGAGAGCCTA TGGAAACAAA AGTGTTTTTG 
GGCAGCAAAC CGAGGAGTAT ACAAAGAGAT GAAAACGGAA AGCTTGTTAA CAATTTGTCC 
TGCGGTATTG AACTTTCCGT ACCCATTATG TTCTCGGCCA TGAGTTATGG CTCCATCAGC 
TACAATGCCC ATGAATCTTT GGCAAGAGCG GCAAAAGAAG CGGGAATCCT GTACAACACG 
GGAGAAGGTG GACTTCACAG AGACTTATAT CAATACGGTA GCAATACTAT TGTACAAGTG 
GCTTCAGGAA GATTTGGAGT GCATAAAGAC TATCTTGAAG CGGGAGCTGC TATAGAAATA 
AAAATGGGTC AGGGTGCAAA GCCCGGAATA GGAGGACATC TTCCGGGAAC AAAGATAGTA 
GGGGACATAT CCAGAACCAG AATGGTTCCT GAAGGTTCGG ACGCCATTTC TCCGGCCCCG 
CACCATGATA TTTATTCGAT TGAGGACTTA AGGCAGCTGG TTTATTCGCT CAAGGAAGCA 
ACAAATTACA CAAAACCCGT TATAGTCAAA ATAGCGGCCG TCCACAATGT GGCAGCCATT 
GCCAGCGGAA TTGCAAGAAG CGGAGCGGAC ATTATCGCCA TCGACGGATT CCGCGGAGGT 
ACCGGAGCTG CTCCCACAAG AATCAGAGAC AATGTGGGAA TTCCTATTGA ACTTGCTCTG 
GCAAGTGTTG ACCAAAGACT TAGAGAAGAA GGTATAAGAG ACAATGTATC CATTGTTGTG 
GGCGGAAGTA TCAGAAACAG CAGTGATGTT GTAAAAGCAG TTGCATTGGG AGCCGACTGT 
GTTTATATCG GAACGGCTGC GTTGATTGCT TTAGGGTGCC ATCTTTGCAG AAGCTGTCAT 
ACAGGAAAGT GCAACTGGGG TATTGCAACC CAGGAGCCTG AGTTGGTAAA GCGCCTTAAC 
CCCGACATGG GCTATAAGAG ACTGGTTAAT CTTGTGAATG CCTGGAAGCA TGAAATAAAA 
GAAATGATGG GCGGAATGGG AATTAATTCT ATAGAAAGCC TTAGAGGAAA CAGGCTGATG 
CTAAGAGGAG TAGGACTTAA TGAAAAAGAG CTTCAAATAT TAGGAATTAA ACATGCGGGG 
GAATAG

Protein sequence

MGINFLYPEY EVVRNMDRCI NCRVCERQCA NEVHSYDQEK KIMCSDDSKC VNCHRCVALC 
PTRALKIVKT DHTFKENANW RGSIINEIYK QAESGAVLLS SMGNPNEYPV YFDKILLNAS 
QVTNPSIDPL REPMETKVFL GSKPRSIQRD ENGKLVNNLS CGIELSVPIM FSAMSYGSIS 
YNAHESLARA AKEAGILYNT GEGGLHRDLY QYGSNTIVQV ASGRFGVHKD YLEAGAAIEI 
KMGQGAKPGI GGHLPGTKIV GDISRTRMVP EGSDAISPAP HHDIYSIEDL RQLVYSLKEA 
TNYTKPVIVK IAAVHNVAAI ASGIARSGAD IIAIDGFRGG TGAAPTRIRD NVGIPIELAL 
ASVDQRLREE GIRDNVSIVV GGSIRNSSDV VKAVALGADC VYIGTAALIA LGCHLCRSCH 
TGKCNWGIAT QEPELVKRLN PDMGYKRLVN LVNAWKHEIK EMMGGMGINS IESLRGNRLM 
LRGVGLNEKE LQILGIKHAG E