Gene Athe_1445 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1445
Symbol
ID	7408103
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1529244
End bp	1530785
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	37%
IMG OID	643715808
Product	phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_002573316
Protein GI	222529434
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAGA GGGCAATTAT AAGTGTTTAC GATAAAAATG GTATAGTGGA ATTTGCAAAA 
AAGCTAAAAG AGTTTGGATA TGACATTATC TCAACGGGCG GTACTATGAA GTATTTGACC 
GAAAATGGGA TTGAGGTTAT AAATATCTCT GATGTCACCC GTTTTCCAGA GATTTTGGAT 
GGCAGAGTAA AGACTCTTCA TCCCAATATT CACGCAGGAA TTCTTGCAAT GAAGGATAAT 
AGAGAACACT TGGAAACTTT AAAGGCGTTG GATATTCTAC CTATCGACAT GGTTGTGGTT 
AACCTTTATC CGTTTAAAGA GACTATTTTC AAAGAAGATG TTACACTTGA TAACGTTATA 
GAAAATATAG ATATAGGCGG GCCAACCATG ATTCGAGCTG CTGCAAAAAA TTTTAAATAC 
ACAACAGTTA TAGTTGACCC TGAAGATTAC GATATAGTAG CAATGGAAAT AGAAAAAAAT 
GGAGAAGTTT CTTATGAGAC AAGATTTTAT CTTGCCACAA AAGTTTTTGA ATACACCTCT 
TATTATGATT CAATGATTTT TAACTATTTC AAACATGTAA GAAAAGACCA ATCGTTTTCG 
AAGCATTTTA CAGTCCCACT TGAACTTTTA CAGTACTTAA GATATGGAGA AAATCCTCAC 
CAGAAGGCAT GTTTTTATAA GATATCATTA CCGTTCATCG AAACCTCTAA TATTGTGAAT 
TGTACACAGC TTCATGGTAA AGAACTTTCG TATAACAATA TCCTTGACAG TGACAGTGCT 
ATAGAACTTT TGAAGGAATT TGATGAACCC ACATGTGTTG CTATAAAGCA CAACAATCCA 
TGTGCGGTGG CATCAGCAGA GAATATTAAT GAGGCTTACA AAAAGGTTTA TGAAAGTGAC 
CCGATATCAA TATTTGGCGG GATTGTTGCT TTCAACAGAA AGGTTGACAA AAATGTGGCA 
GAACAGCTCA AAAAGATATT TCTTGAAATT GTAATTGCTC CGGAATTTGA CGAGGATGCT 
CTTTCCATTT TGTGTTCTAA AAAAGATTTG AGAGTTTTAA AATTAGCATC CTTAGAAAAG 
ACTGATACTT TCTACGATAT AAAATCTGTA AACGGCGGTG CTTTAGTACA AGAAAAGGAT 
AGAATGCTTC TTGCAGACCA ACTTCAGGTT GTCACGGAAA GAAAACCTTC AGAAAAGGAA 
TTGGAAGATT TAATCTTTGC ATGGAAGGTT GTAAAACATG TGAAGTCAAA TGCTATAGTT 
GTAGCAAAAG ATAAAATGAC CCTGGGCATT GGAACGGGTC AGACAAATAG AATATGGGCG 
GTAGAACATG CTATTTCGAG GTCGCGATTT GATTTAAAGG GAGCAGTGCT TGCGTCCGAC 
GCGTTCTTCC CATTTTCAGA CAGTGTCGAA GCTGCGGGCA AAGCAGGAAT TAGTGCTATT 
ATTCAGCCAG GTGGTTCTAT CCGCGACAAG GATTCAATTG AGATGGCAAA CAGGTTCAAT 
ATAGCTATGG TATTCACAGG AATGAGACAT TTTAGGCATT AA

Protein sequence

MNKRAIISVY DKNGIVEFAK KLKEFGYDII STGGTMKYLT ENGIEVINIS DVTRFPEILD 
GRVKTLHPNI HAGILAMKDN REHLETLKAL DILPIDMVVV NLYPFKETIF KEDVTLDNVI 
ENIDIGGPTM IRAAAKNFKY TTVIVDPEDY DIVAMEIEKN GEVSYETRFY LATKVFEYTS 
YYDSMIFNYF KHVRKDQSFS KHFTVPLELL QYLRYGENPH QKACFYKISL PFIETSNIVN 
CTQLHGKELS YNNILDSDSA IELLKEFDEP TCVAIKHNNP CAVASAENIN EAYKKVYESD 
PISIFGGIVA FNRKVDKNVA EQLKKIFLEI VIAPEFDEDA LSILCSKKDL RVLKLASLEK 
TDTFYDIKSV NGGALVQEKD RMLLADQLQV VTERKPSEKE LEDLIFAWKV VKHVKSNAIV 
VAKDKMTLGI GTGQTNRIWA VEHAISRSRF DLKGAVLASD AFFPFSDSVE AAGKAGISAI 
IQPGGSIRDK DSIEMANRFN IAMVFTGMRH FRH