Gene Cthe_1249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1249
Symbol
ID	4809754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1513511
End bp	1514977
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	44%
IMG OID	640106672
Product	amidophosphoribosyltransferase
Protein accession	YP_001037674
Protein GI	125973764
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0034] Glutamine phosphoribosylpyrophosphate amidotransferase
TIGRFAM ID	[TIGR01134] amidophosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.917797
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGATG TAATAAGGGG AAAGCATTTT AATTACGTAC ACAATTTGTT GAAAAAAGAT 
GAGTTTGGGT TTGACAAGCC GAAAGAAGAG TGTGGAGTTT TCGGTATTTA CAGTAAAGGT 
AATTTGGATA CCGCACGTCT GACTTATTAT GCCCTTTATG CGCTTCAGCA CAGAGGACAG 
GAAAGTGCGG GAATTGCCGT CAACAATGGT GGGACACTTC TCTTTCACAA GGACATGGGG 
CTTGTTCCCG AGATTTTCAA TGAAAAAATT TTAAACAGTC TCAAAGGCAA AATTGCAATA 
GGACATGTGA GATATTCGAC TACCGGTGCG AGCAGCAGGG AAAACTCCCA GCCTATGGTT 
ATAAAGTACA AGAACGGACA GATGGCCATG GCTCATAACG GCAATCTTGT TAATGCCGCA 
AAGATAAGAG AAAAACTTGA GGAAGAGGGT ATTATATTCC AGTCGACTAT AGATTCCGAG 
GTAATTTTGA ATTTGATTTC AAGATTCAGG CTGACCAGCA ACAATATTGA AGAGGCCATT 
GTCAAGGTAA TGAAGGAGAT AAAAGGTGCG TATTCGCTGG TTATTCTCAC ACCAAACAAG 
CTTATTGGTA TCAGAGACCC TCACGGTATA AGACCGCTTT GCATCGGCCG TATAGATGAT 
TCCTATGTTC TTGCTTCAGA GACTTGCGCT CTTGATGCAG TAGATGCCGA ATATGTAAGA 
GATGTAAATC CCGGAGAGAT TATCGTTATT GAAGAGAGCG GAATGACTTC AATACAAACG 
GAAGTTCCGG AAAAGACGGC ACTTTGCATT TTTGAGTATA TTTACTTTGC AAGACCCGAC 
AGCTATATTG ACGGTGTAAG TGTTCACAGA GCGAGAATTG AGGCCGGAAG AAGGCTTGCC 
CGGGAGCATC CTGTGGAAGC CGACCTTGTT TTCGGAGTTC CGGATTCGGG TGTATCCGCG 
GCACTGGGTT ATTCCATGGA GTCGGGAATA CCTTATGATT TGGGACTTAT AAAAAACAAA 
TATATCGGAA GAACCTTTAT TCAGCCGGAA CAGGGACAGA GGGAAAGCGG AGTGAAAATT 
AAGCTTAATG CTTTGAAGGA AGCCGTTAAC GGTAAAAGGG TTGTTATGAT AGATGACTCA 
ATAGTCAGAG GTACTACCAG CAAGAGACTT GTTCAAATTT TAAGGGATGC CGGTGCGAAG 
GAAGTTCATA TGAGAATCAG CTCTCCGCCT TATATGTATC CATGTTTCTT TGGAGTTGAC 
ACATCGAGCA GGTCCCAGCT TATTGCGGCG GAATGTTCCG TTGAGGAAAT CAGAAAGATG 
ACAGGTGCGG ACAGCCTTGG GTACTTAAGT CTCGAAGGGC TCTTGAAAAC GCCGGTGGGA 
GCAAAATGCG GTTTTTGTAC CGGATGCTTC ACAGGCAAAT ATCCGATGGA AGTACCTAAA 
GATGCCAGCA AGTATAGTTG CGGGTAA

Protein sequence

MFDVIRGKHF NYVHNLLKKD EFGFDKPKEE CGVFGIYSKG NLDTARLTYY ALYALQHRGQ 
ESAGIAVNNG GTLLFHKDMG LVPEIFNEKI LNSLKGKIAI GHVRYSTTGA SSRENSQPMV 
IKYKNGQMAM AHNGNLVNAA KIREKLEEEG IIFQSTIDSE VILNLISRFR LTSNNIEEAI 
VKVMKEIKGA YSLVILTPNK LIGIRDPHGI RPLCIGRIDD SYVLASETCA LDAVDAEYVR 
DVNPGEIIVI EESGMTSIQT EVPEKTALCI FEYIYFARPD SYIDGVSVHR ARIEAGRRLA 
REHPVEADLV FGVPDSGVSA ALGYSMESGI PYDLGLIKNK YIGRTFIQPE QGQRESGVKI 
KLNALKEAVN GKRVVMIDDS IVRGTTSKRL VQILRDAGAK EVHMRISSPP YMYPCFFGVD 
TSSRSQLIAA ECSVEEIRKM TGADSLGYLS LEGLLKTPVG AKCGFCTGCF TGKYPMEVPK 
DASKYSCG