Gene Acel_1114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1114
Symbol
ID	4485777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	1236786
End bp	1237793
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	64%
IMG OID	639729889
Product	glyceraldehyde-3-phosphate dehydrogenase
Protein accession	YP_872872
Protein GI	117928321
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.182905
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.197061
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGATTC GTGTGGGCAT CAACGGGTTT GGGCGCATCG GCCGTAACTT TTTCCGAGCG 
GTTGCCGCGC ACCAGGGCAG CAATCTCGAT GTGGTAGCCG TCAACGACCT CACCGACACC 
AAAACGCTGG CGCATCTGTT GAAGTACGAC ACGGTCCTCG GCCCATTCCC GGGCGAGGTT 
CGTGCCGGCG ACGGTGTCAT TGTCGTCGAC GGCAAGGAAA TCCGCGTGCT CTCGGAGAAA 
GATCCAGCGC AGCTGCCGTG GGGCGAGCTG GGTGTTCAGA TCGTGGTTGA GTCGACGGGA 
CGCTTCACCG ACGCCGAGAA AGCCCGGGCG CACCTGGCGG CGGGCGCCAA GAAGGTCATC 
ATTTCCGCGC CGGCCAAGGG GGAGGACGCG ACGTTCGTCC TCGGCGTCAA CGAAGACACC 
TACGATCCGG CGAAGCACCA TGTGATCAGC AACGCGTCGT GCACGACGAA CTGCGTGGCG 
CCGCTGGCCA AGGTCCTGCA CGAGGCGTTC GGCATCGTGA GGGGCTTCAT GACGACGGTT 
CACGCCTACA CGAACGATCA GGTGATCCTT GACTTCCCGC ACAAGGACCT CCGCCGGGCG 
CGTGCCGCGG CGCAGAACAT CATTCCCACG ACGACCGGCG CCGCCAAGGC GGTGGCGCTC 
GTCTTGCCCG AGCTGAAGGG GAAGCTCGAC GGTTTTGCAC TGCGGGTGCC CGTACCTGAC 
GGCTCGGTGA CCGACCTGGT CTGCGAACTC GAGCGCGAGG TGACGAAGGA AGAGGTCAAC 
GCGGCGTACA AGGCGGCGGC CGAGGGGCAG CTCAAGGGCT ATCTCGTTTA CACCGAGGAC 
CCGATCGTGT CGTCGGACAT CGTCAACAAC CCGGCGTCCT GCATCTTTGA CTCCTCGCTC 
ACCATGGTCA ACGGCCGGCA GGTGAAGGTG ATCGGCTGGT ACGACAACGA GTGGGGGTAT 
TCCAACCGGC TTGCCGACCT GACCGCTCTC GTCGCTTCCC GGTTGTAG

Protein sequence

MAIRVGINGF GRIGRNFFRA VAAHQGSNLD VVAVNDLTDT KTLAHLLKYD TVLGPFPGEV 
RAGDGVIVVD GKEIRVLSEK DPAQLPWGEL GVQIVVESTG RFTDAEKARA HLAAGAKKVI 
ISAPAKGEDA TFVLGVNEDT YDPAKHHVIS NASCTTNCVA PLAKVLHEAF GIVRGFMTTV 
HAYTNDQVIL DFPHKDLRRA RAAAQNIIPT TTGAAKAVAL VLPELKGKLD GFALRVPVPD 
GSVTDLVCEL EREVTKEEVN AAYKAAAEGQ LKGYLVYTED PIVSSDIVNN PASCIFDSSL 
TMVNGRQVKV IGWYDNEWGY SNRLADLTAL VASRL