Gene Cthe_1863 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1863
Symbol
ID	4809414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	2208749
End bp	2209789
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	42%
IMG OID	640107282
Product	N-acetyl-gamma-glutamyl-phosphate reductase
Protein accession	YP_001038277
Protein GI	125974367
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0002] Acetylglutamate semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01850] N-acetyl-gamma-glutamyl-phosphate reductase, common form

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGTG TAGGAATTAT AGGAGCTACC GGTTATGTTG GAACAGAAAT TGTTCGACTT 
CTTCAAAATC ATCCGGATAT AAACATTACT TCTGTCGTAT CCCACAACTT TGCGGGGCAG 
AAGATATCGG ACATATACCC AAATCTTAAG AATGTTTTTG AAATGGAATG CGATGAGCTT 
GATATAGATA AAATTGCCGA CAAAGCTGAA GTGTTTGTCA CTGCGCTTCC TCACGGCATA 
TCAAAGGAAG TGATACCCAA GCTTGTTGAA AAAGGTAAAA GAATAGTTGA CCACAGCGGC 
GATTTTCGCT ACAAGTCTGT TGAAGTGTAT GAAAAATGGT ACAACGCTAC CCATGGAATG 
CCGCATCTTT TGAAACTTTC GGCATATGGT CTGCCTGAGC TTCACAGAGA AGAAATAAAA 
AATGCACAGA TAATAGGCAA TCCCGGCTGT TATCCGACTT GTTCGATACT GGCGCTGGCT 
CCGTTAGTCA AAAACAGACT TGTTGACACA AAAAATATCA TAATTGACGC AGCTTCCGGA 
GTTTCGGGAG CCGGAAGAAA AACCGATCTT CCCTACCAGT TCTGCGAGTG TGACGAAAAT 
TTCAAAGCAT ACAGTGTTTC AAACCACAGG CATACCTCTG AAATTGAGCA GGAGCTCTCT 
CTTTTGGCAG AAGAGGAAAT TACCGTTTCG TTCACTCCTC ATCTTGTACC AATGAAAAGA 
GGAATGCTTG CAACCATTTA TGCAAATTTG AACTGTGAAA AATCAACATC GGAATTAATT 
GAGCTGTATA AGGAATATTA TAAAAATGAA TATTTTGTGA GGATACTGGA TGAAGGCAAA 
CTTCCTGAAA CCAAATTTGT AGCCGGATCA AACTTTATTG ACATCGGTCT TGTTGTGGAT 
AAGCGTTTAA ACAGGGTTGT CATCCTCTCT GCCATTGACA ATTTGGGCAA AGGTGCTGCA 
GGTCAAGCCG TCCAGGTTCT CAATATATTG TTCGGGCTTC CCGAGCACAG AGGTCTGACC 
AATCCCGGTT TCTACCTATA A

Protein sequence

MASVGIIGAT GYVGTEIVRL LQNHPDINIT SVVSHNFAGQ KISDIYPNLK NVFEMECDEL 
DIDKIADKAE VFVTALPHGI SKEVIPKLVE KGKRIVDHSG DFRYKSVEVY EKWYNATHGM 
PHLLKLSAYG LPELHREEIK NAQIIGNPGC YPTCSILALA PLVKNRLVDT KNIIIDAASG 
VSGAGRKTDL PYQFCECDEN FKAYSVSNHR HTSEIEQELS LLAEEEITVS FTPHLVPMKR 
GMLATIYANL NCEKSTSELI ELYKEYYKNE YFVRILDEGK LPETKFVAGS NFIDIGLVVD 
KRLNRVVILS AIDNLGKGAA GQAVQVLNIL FGLPEHRGLT NPGFYL