Gene Cthe_0202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0202
Symbol
ID	4808620
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	244786
End bp	246108
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	41%
IMG OID	640105615
Product	L-glutamine synthetase
Protein accession	YP_001036636
Protein GI	125972726
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0174] Glutamine synthetase
TIGRFAM ID	[TIGR00653] glutamine synthetase, type I

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTATA ATATAAAAAT AAAAGAGGTG CTGGAGTTTG TCGAAGAAAA TGACGTGAAA 
TTTATCCGAC TCGCCTTTTG TGATATTCTG GGGATTCCAA AGAATATTTC CATCATGCCC 
CAGGAACTTG AAAGAGCGTT TGAACAAGGT ATATCCTTTG ATGCGTCTTC AATTTTGGGA 
TTTATGAATG TTGAAAAATC CGATTTGTTT TTACATCCTG ACCCATCGAC TTTAAGCATT 
TTGCCCTGGA GACCCCAGCA GGGAAGGGTA ATACGTTTTT TCTGCGACAT AAAGCATCCG 
GATGGAAGTG CGTTTGAGGG AGATTCAAGA AATATTCTTA AAAAAGCGGT GGAACGGGCG 
GAAAAAATGG GGTATGCGTG CAGAATAGGT TCGGAGTGCG AATTTTATTT GTTTGAAACC 
GATGAAAAAG GAAGACCCAC ATATATTCCC CATGATGAGG GGGGATATTT GGATATGGCG 
CCCCTTGACA AAGGGGAGAA CGTAAGAAGG GAGATTTGCC TGTCGCTTGA ACAAATGGGA 
ATTCAGCCGG AAAGTTCCCA TCATGAACAG GGGCCCGGGC AACATGAAAT AGACTTTAAA 
TACAGTGACG CTCTTACAGC TGCAGATGAT TTGATGACTT TCAAGACGGT GGTCAAGGCT 
GTTGCATCAA GAAACGGACT TTTTGCCTCC TTTATGCCGA AACCCATTTT GACTGAAAGC 
GGCAGCGGAC TTCATATTAA TATATCTCTT TCAAAGGACG GATTTAATAT TTTCAAAGAG 
AGGAATTATG ATTCTTCGGC CGCTAAAAGC TTTATTGCCG GGGTTATTGA TAAAATATTG 
GATATTACCG CATTTGCAAA TCCGATAACG AATTCTTATG CCCGGCTTGG AAGTTTCAGG 
GCGCCGAAAT ACGTATCCTG GTCTCATCAA AATCGTTCCC AGCTTATAAG AATCCCTGCT 
GAAACAGGGG AATACAGCAG AATGGAACTT CGTTCTCCGG ATCCGGCCTG CAATCCTTAC 
ATTACTTTCG CTCTTATTTT GCATGCGGGA CTTGACGGGA TAGAGAGAAA ATTGGAGCTT 
CCCGGGCCGA TTAATCAGAA TTTGTACAAT GCCGGCGCTG ATGAGTTGCA AAATATCAAA 
GCTCTTCCGC AGAATTTGAA AGAGGCTTTG GATGTTGCAT CAAAAAGTAG TTTTGTAAGA 
AACATTTTAG GCGAGGAAAT GTTAAGCAAG TATTTGGAGA TAAAGCTAAA AGAGTGGAAC 
ATGTATTTTG AAAGTGAAGA CAGGGAAAGC GTGGAAAAAC AGATGTATTT TAAAATTATT 
TAA

Protein sequence

MSYNIKIKEV LEFVEENDVK FIRLAFCDIL GIPKNISIMP QELERAFEQG ISFDASSILG 
FMNVEKSDLF LHPDPSTLSI LPWRPQQGRV IRFFCDIKHP DGSAFEGDSR NILKKAVERA 
EKMGYACRIG SECEFYLFET DEKGRPTYIP HDEGGYLDMA PLDKGENVRR EICLSLEQMG 
IQPESSHHEQ GPGQHEIDFK YSDALTAADD LMTFKTVVKA VASRNGLFAS FMPKPILTES 
GSGLHINISL SKDGFNIFKE RNYDSSAAKS FIAGVIDKIL DITAFANPIT NSYARLGSFR 
APKYVSWSHQ NRSQLIRIPA ETGEYSRMEL RSPDPACNPY ITFALILHAG LDGIERKLEL 
PGPINQNLYN AGADELQNIK ALPQNLKEAL DVASKSSFVR NILGEEMLSK YLEIKLKEWN 
MYFESEDRES VEKQMYFKII