Gene Sama_0395 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_0395
Symbol	purH
ID	4602650
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	-
Start bp	491215
End bp	492804
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	60%
IMG OID	639779731
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_926275
Protein GI	119773535
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.93923
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAATG CCAGACCCAT TCGCCGCGCG CTGCTGAGCG TGTCCGATAA AACAGGTATC 
CTCGAGTTTG CCCAGGCGCT GCACGCACAG GGCGTAGAAC TGCTGTCCAC CGGTGGCACC 
GCCAAGCTGC TGGCCGATAA CGGCGTACCT GTGATCGAAG TTTCTGACTA CACAGGTCAC 
CCTGAGATCA TGGACGGTCG GGTCAAGACC CTGCATCCCA AGGTGCATGG TGGCATTCTG 
GCGCGTCGCG GCCAGGACGA AGACGTGATG GCTGCCAACA ACATTGGCCC TATCGATCTG 
GTTGCCGTTA ACCTGTATCC CTTTGCTGCC ACCGTAGCCA AGCCTGGCTG TACCCTGGAA 
GACGCCATCG AGAACATCGA TATCGGCGGC CCTACCATGG TGCGCGCTGC CGCCAAGAAC 
CACAAAGACG TGGTGATTGT GGTGAACGCC AAAGACTACG ACCGCGTACT GGCCGAAATG 
AGCGCCAATG GCGGCTCTAC CAGCCACGCT ACCCGTTTCG ATTTGGCCAT TGCCGCCTTC 
GAGCACACCG CCGCTTACGA TGGCATGATT GCCAACTACT TCGGCACCAT GGTTCCGGCT 
CACAGCAGCG ACGAGTGCCA CGACGACTCC AAATTCCCAC GCACCTTCAA CACCCAGCTG 
GTGAAGAAGC AGGACCTGCG CTACGGCGAA AACAGCCACC AGAGCGCCGC CTTCTACGTG 
GATTTGAACA GCGACGAGGC CTCTGTGGCC ACCGCCACTC AGCTGCAGGG TAAGGCTCTG 
TCTTACAACA ACATCGCCGA CACCGATGCC GCCCTTGAGT GCGTAAAAGA ATTCGACGCC 
CCAGCCTGCG TTATCGTCAA GCACGCCAAC CCCTGTGGTG TGGCCCTGGG CGACAACCTG 
CTGGACGCGT ACAACCGCGC CTACAAGACC GACCCCACTT CTGCTTTCGG TGGCATCATC 
GCCTTTAACC GCGAGCTGGA CGGCGAAACC GCCGCCGCCA TCGTTGAGCG TCAGTTTGTG 
GAAGTGATTA TCGCCCCTGT GGTGAGCCAA GCCGCCCGTG ACGTGGTTGC CAAGAAGACC 
AACGTGCGCC TGCTGGAATG TGGTCAATGG ACTGCGCAGA CCAAGGGTCT GGACTACAAG 
CGCGTAAACG GCGGCCTGCT TATTCAGGAC CGCGATCAGG GTATGGTGAC CGAGGCCGAA 
CTCAAGGTCG TGACCAAGCG TGTACCGACC GAAGCTGAAC TGAAAGATCT GATGTTCTGC 
TGGAAAGTGG CCAAGTTCGT GAAATCCAAC GCCATCGTGT ATGCCAAAGA AGGCATGACC 
ATAGGCGTGG GCGCAGGCCA GATGAGCCGC GTCTACAGTG CCAAGATTGC CGGTATCAAG 
GCCGCCGACG AAGGTCTGGT GGTTGAGGGC TCTGTGATGG CGTCCGACGC CTTCTTCCCA 
TTCCGCGACG GTATCGACGC CGCAGCGGCT GCCGGGATCA GCTGCATCAT CCAGCCCGGC 
GGTTCTATCC GCGACGAGGA AGTGATTGCC GCCGCCGACG AGCACGGCAT GGCCATGGTG 
TTCACCAACA TGCGCCACTT CCGCCACTGA

Protein sequence

MNNARPIRRA LLSVSDKTGI LEFAQALHAQ GVELLSTGGT AKLLADNGVP VIEVSDYTGH 
PEIMDGRVKT LHPKVHGGIL ARRGQDEDVM AANNIGPIDL VAVNLYPFAA TVAKPGCTLE 
DAIENIDIGG PTMVRAAAKN HKDVVIVVNA KDYDRVLAEM SANGGSTSHA TRFDLAIAAF 
EHTAAYDGMI ANYFGTMVPA HSSDECHDDS KFPRTFNTQL VKKQDLRYGE NSHQSAAFYV 
DLNSDEASVA TATQLQGKAL SYNNIADTDA ALECVKEFDA PACVIVKHAN PCGVALGDNL 
LDAYNRAYKT DPTSAFGGII AFNRELDGET AAAIVERQFV EVIIAPVVSQ AARDVVAKKT 
NVRLLECGQW TAQTKGLDYK RVNGGLLIQD RDQGMVTEAE LKVVTKRVPT EAELKDLMFC 
WKVAKFVKSN AIVYAKEGMT IGVGAGQMSR VYSAKIAGIK AADEGLVVEG SVMASDAFFP 
FRDGIDAAAA AGISCIIQPG GSIRDEEVIA AADEHGMAMV FTNMRHFRH