Gene Shew185_3913 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shew185_3913
Symbol	purH
ID	5371186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS185
Kingdom	Bacteria
Replicon accession	NC_009665
Strand	+
Start bp	4640094
End bp	4641692
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	52%
IMG OID	640832174
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_001368100
Protein GI	153002419
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGCTG CAAATAATGC CAGACCCATT CGTCGCGCGC TGTTAAGCGT TTCAGATAAA 
ACCGGAATTC TCGAGTTCGC CAAAGCACTT CACGCCCAAG GTGTGGAGCT GTTGTCAACT 
GGCGGCACCG CTCGCCTGTT AGCGGATAAC GGCGTGCCTG TTATCGAAGT ATCTGATTAC 
ACAGGACACC CTGAGATCAT GGACGGTCGC GTTAAGACGC TGCACCCTAA AGTGCACGGC 
GGCATTTTGG CGCGCCGCGG TCTTGATGAA AGCGTGATGG CCGACAACAA TATCAATGCC 
ATCGATCTGG TTGCGGTTAA CCTTTATCCT TTCGCTGAAA CTGTGGCTAA AGCCGGTTGT 
ACCTTAGAAG ACGCTATCGA AAATATCGAT ATTGGCGGCC CAACTATGGT GCGCGCAGCG 
GCAAAAAACC ACAAAGACGT CACCATAGTC GTTAATGCCG CCGATTACTC ACGCGTACTG 
GCAGAAATGA CGGCTAACAA TGGCAGCACG ACCCATGCGA CGCGTTTCGA CTTAGCGATT 
GCGGCCTTTG AGCACACTGC GGGTTACGAT GGCATGATCG CCAACTACTT CGGCACTATG 
GTTCCTGCGC ATAGCACGGA CGAATGCTTT GCTGATTCTA AGTTCCCACG CACGTTCAAC 
ACCCAATTAG TGAAGAAGCA AGACTTACGC TATGGCGAAA ACAGCCATCA AGCGGCGGCC 
TTCTATGTCG ATACGAAAAT TGATGAAGCC TCTGTGGCGA CGGCAATTCA GTTGCAAGGC 
AAAGCCTTGT CTTACAACAA CATTGCCGAT ACCGACGCCG CTCTTGAGTG CGTAAAAGAA 
TTCTTGGAAC CCGCCTGCGT TATCGTTAAA CACGCTAACC CATGTGGTGT GGCCTTAGGT 
AAAGACTTGC TCGATGCCTA TAACCGCGCT TATCAAACTG ACCCAACCTC AGCCTTCGGT 
GGCATTATTG CTTTCAACGG CGAGTTAGAT GCCGCGACGG CGAGTGCTAT CGTTGAGCGT 
CAATTCGTTG AAGTGATTAT CGCCCCAAGC GTCAGCCAAG CGGCGCGCGA TGTGGTGGCG 
AAAAAGACCA ACGTGCGTTT ATTGGAATGT GGTCAGTGGA ACACTAAGAC CCAAACCTTA 
GACTACAAAC GCGTTAACGG CGGCTTGTTA GTACAAGATC GCGACCAAGG CATGGTCGGC 
TTAGAAGACA TCAAAGTGGT TTCTAAACGT CAACCAACTG CAAGCGAACT GAAAGACTTA 
ATGTTCTGCT GGAAAGTGGC GAAATTCGTT AAATCTAACG CCATCGTTTA TGCCAAAGAC 
GGCATGACTA TCGGTGTCGG CGCAGGCCAA ATGAGCCGCG TTTACAGCGC TAAAATCGCT 
GGCATCAAGG CCGCCGATGA AGGCTTAGAA GTAGTGAACT CTGTGATGGC ATCCGATGCT 
TTCTTCCCCT TCCGTGACGG TATCGATGCC GCAGCGGCTG CGGGCATTAG CTGCATCATC 
CAACCGGGTG GCTCAATGCG CGATGCTGAA ATCATCGCTG CAGCAGACGA GCACGGCATG 
GCCATGGTGA TGACGGGCAT GCGCCACTTC CGTCACTAA

Protein sequence

MTAANNARPI RRALLSVSDK TGILEFAKAL HAQGVELLST GGTARLLADN GVPVIEVSDY 
TGHPEIMDGR VKTLHPKVHG GILARRGLDE SVMADNNINA IDLVAVNLYP FAETVAKAGC 
TLEDAIENID IGGPTMVRAA AKNHKDVTIV VNAADYSRVL AEMTANNGST THATRFDLAI 
AAFEHTAGYD GMIANYFGTM VPAHSTDECF ADSKFPRTFN TQLVKKQDLR YGENSHQAAA 
FYVDTKIDEA SVATAIQLQG KALSYNNIAD TDAALECVKE FLEPACVIVK HANPCGVALG 
KDLLDAYNRA YQTDPTSAFG GIIAFNGELD AATASAIVER QFVEVIIAPS VSQAARDVVA 
KKTNVRLLEC GQWNTKTQTL DYKRVNGGLL VQDRDQGMVG LEDIKVVSKR QPTASELKDL 
MFCWKVAKFV KSNAIVYAKD GMTIGVGAGQ MSRVYSAKIA GIKAADEGLE VVNSVMASDA 
FFPFRDGIDA AAAAGISCII QPGGSMRDAE IIAAADEHGM AMVMTGMRHF RH