Gene Sde_0806 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_0806
Symbol
ID	3966405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	1051830
End bp	1053410
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	47%
IMG OID	637919868
Product	phosphoribosylaminoimidazolecarboxamide formyltransferase / IMP cyclohydrolase
Protein accession	YP_526280
Protein GI	90020453
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.663158
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAATG TTGCAGATTA TGTTCAAGTT AAACGCGCTC TTATTAGCGT TTCGGACAAA 
ACTGGCATTA TCGAATTTGC CCAAGCGCTA GCGCGCCAAG GTGTAGAAAT TTTTTCCACC 
GGTGGAACCT TCCGCTTGCT AAGCGAAAAC AACATCGCGG CAACAGAAAT TTCAGACTAT 
ACCGGCTTCC CAGAAATGAT GAGTGGACGT GTAAAAACCT TACACCCCAA AGTCCACGGT 
GGCATTTTAG GGCGCAGAGG CATAGACGAC GAAGTAATGC AGGAACACGG CATTAAGCCA 
ATCGACATGG TTGTTGTTAA TCTTTACCCG TTTGAAAAAA CCGTTGCCCA ACCAGACTGC 
GAATTAGTAG ATGCCATCGA AAATATCGAC ATCGGCGGCC CAACCATGGT TCGCGCAGCG 
GCTAAAAACC ACAATCACGT AGCGATAGTT GTAAACAGCC ACAGTTACGC TTCTGTGCTT 
ACAGAAATGG AAATGAACAA CGGTGCACTA TCGCTAGCTA CACGTTTCGA CTTATGTGTA 
CAAGCTTACG AACATACAGC CGCGTACGAT GGCGCAATTG CCAACTACTT AGGCGCTAAA 
GTTGAAAAAG CGGAAGACAA ATTCCCGCGC ACCTTTAACA CCCAGTTTGT TAAAGCCCAA 
ACTATGCGCT ACGGCGAAAA CCCGCACCAA CAAGCGGCTT TTTATGTAGA AAAGAATTCT 
CGCGAAGCAA GCATTTCAAC GGCTATTCAA TTGCAAGGAA AAGAGCTTTC GTTTAACAAC 
GTTGCCGATA CCGATGCCGC ATTAGAAACC GTTAAATTGT TTAGCGAGCC TGCATGTGTA 
ATTGTAAAAC ACGCCAACCC TTGCGGCGTA GCGCAAGCAG ATAACTTGTT AGATGCTTAT 
CAAAAAGCGT TTGAAACAGA CCCAGAATCT GCATTTGGCG GCATCATTGC TTTTAACCGC 
GAGCTAGATG CAAAAACTGC AGAAGCTATT GTAGAAAAGC AATTCGTAGA AGTTATTATC 
GCGCCCTCTG TTTCTCAAGC AGCTTCCGAT ATTGTTAGCG CTAAGAAAAA TGTCCGTCTA 
CTTTCTTGCG GCCAATGGTC TGCAGCTAGC GAACACGCAT TTGACTACAA GCGCGTTAAC 
GGTGGCCTAC TGGTACAAGA TCGCGACAAC GGCATGATTG AAACAGCCGA CTTAAAAGTT 
GTTACCAAAC GCCAGCCTAC TGAAGACGAA ATACGCGATT TATTATTCGC TTGGAAAGTG 
GCAAAAATGG TTAAGTCCAA CGCAATTGTT TACGGCAAAG ACAGCCGTAC CATTGGTGTA 
GGCGCTGGCC AAATGAGTCG CGTTAACTCT GCCCGTATTG CCGCAATCAA AGCCGAGCAC 
GCAGGCTTAG AAGTTAAAGG CTCGGTAATG GCATCAGACG CGTTCTTCCC GTTCCGCGAC 
GGCATAGATA ACGCAGCAGC CGTTGGTATT GCTGCCGTTA TTCAACCTGG TGGCTCTATG 
CGCGATGAAG AAACCATCGC AGCTGCCGAC GAGCACGGCA TGGCCATGGT GTTTACCGGT 
ATGCGCCACT TCCGTCACTA A

Protein sequence

MPNVADYVQV KRALISVSDK TGIIEFAQAL ARQGVEIFST GGTFRLLSEN NIAATEISDY 
TGFPEMMSGR VKTLHPKVHG GILGRRGIDD EVMQEHGIKP IDMVVVNLYP FEKTVAQPDC 
ELVDAIENID IGGPTMVRAA AKNHNHVAIV VNSHSYASVL TEMEMNNGAL SLATRFDLCV 
QAYEHTAAYD GAIANYLGAK VEKAEDKFPR TFNTQFVKAQ TMRYGENPHQ QAAFYVEKNS 
REASISTAIQ LQGKELSFNN VADTDAALET VKLFSEPACV IVKHANPCGV AQADNLLDAY 
QKAFETDPES AFGGIIAFNR ELDAKTAEAI VEKQFVEVII APSVSQAASD IVSAKKNVRL 
LSCGQWSAAS EHAFDYKRVN GGLLVQDRDN GMIETADLKV VTKRQPTEDE IRDLLFAWKV 
AKMVKSNAIV YGKDSRTIGV GAGQMSRVNS ARIAAIKAEH AGLEVKGSVM ASDAFFPFRD 
GIDNAAAVGI AAVIQPGGSM RDEETIAAAD EHGMAMVFTG MRHFRH