Gene Athe_1406 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1406
Symbol
ID	7409149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1489606
End bp	1490619
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	40%
IMG OID	643715769
Product	glyceraldehyde-3-phosphate dehydrogenase, type I
Protein accession	YP_002573277
Protein GI	222529395
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000337546
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGTTA AGATTGGTAT TAATGGTTTT GGAAGAATTG GTAGAAATGC TTTCAAAGCA 
ATTTTGGCAA ATTATCCAAA TGAGTTTGAG GTTGTTGCGG TAAACGACCT GACAGACCCA 
AAGACATTAG CACATCTTTT AAAGTATGAC TCCTGTTATG GTATCTTCAA TGGCACAGTT 
GACTATACAG ACACATCAAT AATTGTCAAT GGCAAAGAGA TAAAGGTATT AGCTGAAAAA 
GACCCAGCAA ATCTTCCATG GAAAGATTTG GGAGTTGAGG TTGTAATTGA GTCAACAGGT 
AGATTTACAA AGAAACAGGA TGCTGAAAAG CACATTCAAG CAGGTGCAAA GAAGGTAATC 
ATCACAGCTC CGGCAACAGA TGAAGACATC ACAATTGTTA TGGGTGTAAA TGAGGAGATG 
TACGACCCTG CTAAGCACCA TGTAATTTCA AATGCGTCCT GTACAACAAA CTGTTTAGCA 
CCAGTTACAA AGGTTATTGA CAAGCATTTC AAGGTAAAAA GAGGTCTTAT GACAACAGTT 
CACTCATATA CAAATGACCA ACAGATTTTG GATCTCCCAC ACAAGGATTT AAGGAGAGCA 
AGAGCAGCAG CGCTTTCTAT TATTCCAACA ACAACCGGTG CGGCAAAGGC AGTAGCGCTT 
GTTCTTCCAC ATCTCAAAGG AAAACTCAAT GGTTTTGCAC TCAGAGTTCC AACACCAACT 
GTTTCTGTTA CAGACGTTGT GTTTGAGGTT GAAAAGCCAA CAACAAAAGA AGAAGTAAAC 
AGCGTTTTGA AAGCTGCTGC AGAAGGCGAA TTAAAGGGTA TTTTGGGATA CAGCGAAGAA 
CCGCTTGTTT CTGTTGACTA CAAAGGCGAT CCAAGGTCTT CAATAGTTGA TGCTCTCTCA 
ACAATGGTTA TCGAAGATAC ACTTGTAAAG GTTGTTGCAT GGTACGACAA CGAGTGGGGT 
TATTCCAACA GAGTTGCAGA CCTTTTGAAC TATATTGTTA GCAAGGGACT GTAA

Protein sequence

MAVKIGINGF GRIGRNAFKA ILANYPNEFE VVAVNDLTDP KTLAHLLKYD SCYGIFNGTV 
DYTDTSIIVN GKEIKVLAEK DPANLPWKDL GVEVVIESTG RFTKKQDAEK HIQAGAKKVI 
ITAPATDEDI TIVMGVNEEM YDPAKHHVIS NASCTTNCLA PVTKVIDKHF KVKRGLMTTV 
HSYTNDQQIL DLPHKDLRRA RAAALSIIPT TTGAAKAVAL VLPHLKGKLN GFALRVPTPT 
VSVTDVVFEV EKPTTKEEVN SVLKAAAEGE LKGILGYSEE PLVSVDYKGD PRSSIVDALS 
TMVIEDTLVK VVAWYDNEWG YSNRVADLLN YIVSKGL