Gene Sbal223_3840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_3840
Symbol	purH
ID	7088875
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	4549580
End bp	4551178
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	52%
IMG OID	643462719
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_002359740
Protein GI	217974989
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.28825
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCTG CAAATAATGC CAGACCCATT CGTCGCGCGC TGTTAAGCGT TTCAGATAAA 
ACCGGAATTC TCGAGTTCGC CAAAGCACTT CACGCCCAAG GTGTGGAGCT GTTGTCAACT 
GGCGGCACCG CTCGCCTGTT AGCGGATAAC GGCGTGCCTG TTATCGAAGT ATCTGATTAC 
ACAGGACACC CTGAGATCAT GGACGGTCGC GTTAAGACGC TGCACCCTAA AGTGCACGGC 
GGCATTTTGG CGCGCCGCGG TCTTGATGAA AGCGTTATGG CCGACAACAA TATCAATGCC 
ATCGATCTGG TTGCGGTTAA CCTTTATCCT TTCGCTGAAA CTGTGGCTAA AGCCGGTTGT 
ACCTTAGAAG ACGCTATCGA AAATATCGAT ATTGGCGGCC CAACTATGGT GCGCGCAGCG 
GCAAAAAACC ACAAAGACGT CACCATTGTC GTTAATGCGG CCGATTACTC GCGCGTACTA 
GCAGAAATGA CGGCTAACAA TGGCAGCACG ACCCATGCGA CGCGTTTCGA CTTAGCGATT 
GCGGCCTTTG AGCACACTGC GGGTTACGAT GGCATGATCG CCAACTACTT CGGCACTATG 
ATTCCTGCGC ATAGCACGGA CGAATGCTTT GCTGATTCTA AGTTCCCACG CACGTTCAAC 
ACCCAATTAG TGAAGAAGCA AGACTTACGC TATGGCGAAA ACAGCCATCA AGCGGCGGCC 
TTCTATGTCG ATACGAAAAT TAATGAAGCC TCTGTGGCGA CGGCAATTCA GTTGCAAGGC 
AAAGCCTTGT CTTACAACAA CATTGCCGAT ACCGACGCCG CTCTTGAGTG CGTAAAAGAA 
TTCTTGGAAC CCGCCTGCGT TATCGTTAAA CACGCTAACC CATGTGGTGT GGCCTTAGGT 
AAAGACTTGC TCGATGCCTA TAACCGCGCT TATCAAACTG ACCCAACCTC AGCCTTCGGT 
GGCATTATTG CTTTCAACGG CGAGTTAGAT GCCGCGACGG CGAGTGCTAT CGTTGAGCGT 
CAATTCGTTG AAGTGATTAT CGCCCCAAGC GTCAGCCAAG CGGCGCGCGA TGTGGTGGCG 
AAAAAGACCA ACGTGCGTTT ATTGGAATGT GGTCAGTGGA ACACTAAGAC CCAAACCTTA 
GACTACAAAC GCGTTAACGG CGGCTTGTTA GTACAAGATC GCGACCAAGG CATGGTCGGC 
TTAGAAGACA TCAAAGTGGT TTCTAAACGT CAACCAACTG CAAGCGAACT GAAAGACTTA 
ATGTTCTGCT GGAAAGTAGC GAAATTCGTT AAATCTAACG CCATCGTTTA TGCCAAAGAC 
GGCATGACTA TCGGTGTCGG CGCAGGCCAA ATGAGCCGCG TTTACAGCGC TAAAATCGCT 
GGCATCAAGG CCGCCGATGA AGGCTTAGAA GTAGTGAACT CTGTGATGGC ATCCGATGCT 
TTCTTCCCCT TCCGTGACGG TATCGATGCC GCTGCGGCTG CGGGCATTAG CTGCATCATC 
CAACCGGGTG GCTCAATGCG CGATGCTGAA ATCATCGCCG CAGCAGACGA GCACGGCATG 
GCCATGGTGA TGACGGGCAT GCGCCACTTC CGTCACTAA

Protein sequence

MTAANNARPI RRALLSVSDK TGILEFAKAL HAQGVELLST GGTARLLADN GVPVIEVSDY 
TGHPEIMDGR VKTLHPKVHG GILARRGLDE SVMADNNINA IDLVAVNLYP FAETVAKAGC 
TLEDAIENID IGGPTMVRAA AKNHKDVTIV VNAADYSRVL AEMTANNGST THATRFDLAI 
AAFEHTAGYD GMIANYFGTM IPAHSTDECF ADSKFPRTFN TQLVKKQDLR YGENSHQAAA 
FYVDTKINEA SVATAIQLQG KALSYNNIAD TDAALECVKE FLEPACVIVK HANPCGVALG 
KDLLDAYNRA YQTDPTSAFG GIIAFNGELD AATASAIVER QFVEVIIAPS VSQAARDVVA 
KKTNVRLLEC GQWNTKTQTL DYKRVNGGLL VQDRDQGMVG LEDIKVVSKR QPTASELKDL 
MFCWKVAKFV KSNAIVYAKD GMTIGVGAGQ MSRVYSAKIA GIKAADEGLE VVNSVMASDA 
FFPFRDGIDA AAAAGISCII QPGGSMRDAE IIAAADEHGM AMVMTGMRHF RH