Gene Athe_1447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1447
Symbol
ID	7408105
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1531435
End bp	1532460
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	37%
IMG OID	643715810
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_002573318
Protein GI	222529436
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACAT ATAAAGATGC AGGAGTAAAT ATTGAAGAAG GTTACAAAGC GGTGAACTTG 
ATTAAAAGTT TAGCGAGAGA AACTTTTGAT TCAAATGTTA TTACTGACAT AGGTAGTTTT 
GGGAGTATGT ATCTTTTAAA TATTGGAAAT TCTGAATATA TTTTGGTTTC TGGCACAGAT 
GGAGTTGGTA CTAAGCTGAA GATTGCGTTT TACCTTGATA AACATGACAC TGTTGGAATT 
GACTGTGTTG CCATGTGTGT CAATGACATT TTATGTCACG GTGCAAAACC ACTTTTCTTC 
TTAGACTATA TTGCATGTGG TAAACTAAAC AGTAGCAAGG TTGCAAACAT CGTGAAAGGC 
ATTGCTGAAG GTTGCAAAAT GGCAGGATGC TCGCTTGTTG GCGGAGAGAC TGCTGAGATG 
CCAGGATTTT ATAAAGAAGA TGAGTATGAT TTGGCAGGGT TTGTTGTTGG AATTGTTGAA 
AGACAAAAAG CGGTGTGTGG CAAGGATGTA AACACAGGAG ATGTATTAAT TGGACTTGCT 
TCAAGTGGTG TTCACAGCAA TGGTTATTCA CTTGTGAGAA AAGTTTTTGG GATAGATGAT 
AATCCAAAAG TGCTTGAAAA AATATATGAA GAGCTTGGAT TGTCCCTTGG GGAAGAGCTA 
TTGAAGCCAA CAAGGATATA TGTAAAACCT GTTTTGAAAG TGCTTGAAAG GGTAAATGTT 
AAAGGAATAG CCCATATAAC AGGCGGTGGA TTTTTTGAAA ATATACCTCG TGCTTTTCCG 
AAAGGTTACT TTGCCATCAT CGAAAAAGGT AGTTGGGAAG TGCCTGCTAT ATTTAGGTTG 
ATTCAGGAAT ATGGAAAAGT AGAAGAAAGA GAGATGTTTT CAACATTTAA CATGGGAATA 
GGTATGGTTC TAATAGTTTC TGAAGAAGAT GTGGATTTGA CAATGAAGAT TTTAGAACAA 
GAGAAAGTAA ATGCATGGGT AATAGGTACA ATTCAAAAAG GTGAAGACGG AGTTGTTTTA 
AAATGA

Protein sequence

MTTYKDAGVN IEEGYKAVNL IKSLARETFD SNVITDIGSF GSMYLLNIGN SEYILVSGTD 
GVGTKLKIAF YLDKHDTVGI DCVAMCVNDI LCHGAKPLFF LDYIACGKLN SSKVANIVKG 
IAEGCKMAGC SLVGGETAEM PGFYKEDEYD LAGFVVGIVE RQKAVCGKDV NTGDVLIGLA 
SSGVHSNGYS LVRKVFGIDD NPKVLEKIYE ELGLSLGEEL LKPTRIYVKP VLKVLERVNV 
KGIAHITGGG FFENIPRAFP KGYFAIIEKG SWEVPAIFRL IQEYGKVEER EMFSTFNMGI 
GMVLIVSEED VDLTMKILEQ EKVNAWVIGT IQKGEDGVVL K