Gene Sputcn32_3401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sputcn32_3401
Symbol	purH
ID	5078023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella putrefaciens CN-32
Kingdom	Bacteria
Replicon accession	NC_009438
Strand	+
Start bp	3958589
End bp	3960220
Gene Length	1632 bp
Protein Length	543 aa
Translation table	11
GC content	52%
IMG OID	640500601
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_001184911
Protein GI	146294487
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGCTG CAAATAATGC CAGACCCATT CGTCGCGCGC TGTTAAGCGT TTCAGATAAA 
ACCGGAATTC TCGAGTTCGC CAAAGCACTT CACGCCCAAG GTGTAGAATT GTTATCGACT 
GGCGGCACCG CTCGCCTGTT AGCGGATAAC GGCGTGCCTG TTATCGAAGT ATCTGATTAC 
ACAGGACACC CTGAGATCAT GGACGGTCGC GTTAAGACGC TGCACCCTAA AGTGCACGGC 
GGCATTTTAG CGCGCCGCGG TCTTGATGAA AGCGTGATGG CCGACAACAA TATCAATGCC 
ATCGATCTGG TTGCGGTTAA CCTTTATCCC TTCGCTGAAA CGGTCGCTAA AGCTGGTTGT 
ACCTTAGAAG ACGCTATCGA AAATATCGAT ATTGGCGGTC CAACTATGGT GCGCGCGGCG 
GCGAAAAACC ATAAAGATGT GACTATCGTG GTGAATGCGG CCGATTACTC ACGCGTTCTG 
GCTGAAATGA CGGCTAACAA TGGCAGCACC ACCCATGCGA CGCGTTTTGA TTTAGCGATT 
GCCGCCTTTG AGCACACTGC GGGTTACGAT GGTATGATCG CCAACTACTT CGGCACTATG 
GTTCCAATGC ATAGGGTTCC AGCCCACAGC ACGGACGAAT GTTTCGAAGA CTCCCTATCC 
GTTGATGGCT CAAAGTTCCC ACGCACCTTC AACACTCAAT TAGTGAAGAA ACAAGATTTA 
CGCTATGGCG AAAACAGCCA TCAAAAAGCG GCTTTCTATG TTGACACTAA AATTGATGAA 
GCTTCTGTGG CTACCGCGAT TCAGTTGCAA GGCAAAGCCT TGTCTTACAA CAACATTGCC 
GATACTGATG CGGCCCTTGA GTGTGTAAAA GAGTTCAGTG AGCCCGCCTG CGTTATCGTT 
AAACACGCTA ACCCTTGTGG TGTCGCACTC GGTAAAGACC TGCTGGACGC CTACAACCGC 
GCCTATCAAA CTGACCCAAC ATCTGCTTTT GGCGGCATTA TCGCCTTCAA CGGCGAATTA 
GATGCCGAGA CGGCCAGCGC TATCGTTGAG CGTCAATTCG TTGAAGTGAT TATCGCCCCA 
AGCGTCAGCC AAGCGGCGCG CGATGTGATT GCGAAAAAGA CCAACGTGCG TTTATTGGAA 
TGTGGTCAGT GGAACACTAA GACCCAAACC TTAGACTACA AACGCGTTAA CGGCGGCTTG 
TTAGTGCAAG ATCGCGACCA AGGCATGGTT GGCTTAGACG ACATTAAAGT CGTGACTAAG 
CGTCAACCCA CAGAGAGTGA ACTGAAAGAC TTAATGTTCT GCTGGAAAGT GGCGAAGTTC 
GTTAAATCTA ACGCCATCGT TTATGCCAAA GACGGCATGA CTATCGGTGT CGGCGCTGGC 
CAAATGAGCC GCGTTTACAG CGCTAAAATC GCCGGCATCA AGGCCGCCGA TGAAGGGCTA 
GAAGTGGTCA ACTCAGTGAT GGCCTCCGAT GCCTTCTTCC CCTTCCGCGA CGGTATCGAT 
GCCGCTGCGG CGGCAGGCAT TAGCTGCATC ATTCAACCGG GTGGCTCAAT GCGCGATGCT 
GAAATCATCG CTGCTGCAGA CGAGCACGGC ATGGCTATGG TGATGACAGG CATGCGCCAC 
TTCCGTCATT GA

Protein sequence

MTAANNARPI RRALLSVSDK TGILEFAKAL HAQGVELLST GGTARLLADN GVPVIEVSDY 
TGHPEIMDGR VKTLHPKVHG GILARRGLDE SVMADNNINA IDLVAVNLYP FAETVAKAGC 
TLEDAIENID IGGPTMVRAA AKNHKDVTIV VNAADYSRVL AEMTANNGST THATRFDLAI 
AAFEHTAGYD GMIANYFGTM VPMHRVPAHS TDECFEDSLS VDGSKFPRTF NTQLVKKQDL 
RYGENSHQKA AFYVDTKIDE ASVATAIQLQ GKALSYNNIA DTDAALECVK EFSEPACVIV 
KHANPCGVAL GKDLLDAYNR AYQTDPTSAF GGIIAFNGEL DAETASAIVE RQFVEVIIAP 
SVSQAARDVI AKKTNVRLLE CGQWNTKTQT LDYKRVNGGL LVQDRDQGMV GLDDIKVVTK 
RQPTESELKD LMFCWKVAKF VKSNAIVYAK DGMTIGVGAG QMSRVYSAKI AGIKAADEGL 
EVVNSVMASD AFFPFRDGID AAAAAGISCI IQPGGSMRDA EIIAAADEHG MAMVMTGMRH 
FRH