Gene Ssed_0444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssed_0444
Symbol	purH
ID	5612542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sediminis HAW-EB3
Kingdom	Bacteria
Replicon accession	NC_009831
Strand	-
Start bp	553060
End bp	554664
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	51%
IMG OID	640931289
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_001472185
Protein GI	157373585
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.23043
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAATG CCAGACCCAT TCGTCGCGCG CTGTTAAGCG TTTCAGATAA AACCGGAATC 
CTTGAGTTTG CAAAATCTCT ACACGCTCAA GGCGTAGAAC TGCTATCTAC TGGTGGCACC 
GCCCGCCTTT TGGCTGATAA CGGTGTGCCT GTCATTGAAG TATCGGATCA TACCGGACAT 
CCTGAAATTA TGGATGGTCG TGTTAAGACC CTGCACCCTA AAGTGCATGG CGGTATCTTA 
GCGCGCCGCG GTATCGACGA GCTCGTCATG GAACAAAACA ACATCAAGCC TATCGACCTG 
GTTGCCGTCA ACCTGTATCC ATTCGCAGAG ACTGTGGCGA AAGAGGGTTG TACTTTGGCC 
GATGCAGTCG AAAATATCGA TATCGGCGGT CCAACTATGG TTCGCTCTAC GGCGAAAAAC 
CATAAAGACA CCACCATCAT AGTTAACGCG AGTGATTACG ACCGCGTTAT TGTTGAGATG 
AATGCTAATG AAGGCAGCAC GACGCTGGAG ACTCGCTTCG ATTTAGCTAT AGCCGCGTTC 
GAGCACACCG CAGCATATGA CGGCATGATT GCTAATTACT TCGGCACTCA GGTACCGGCA 
CACAGTAAAG ATGAGTGCCA TCACGACTCT AAGTTCCCGC GTACCTACAA TACTCAGCTG 
GTGAAGAAAC AAGATCTGCG TTACGGCGAA AACAGCCACC AGACCGCGGC TTTCTATGTC 
GATAGCCCCT CTTTTAACGG CCAGGGCGAT GAAGCTTCTG TCGCGAGCGC CATACAGCTA 
CAGGGTAAGG CATTGTCTTA CAACAACATC GCCGATACCG ATTCAGCACT CGAGTGCGTG 
AAAGAGTTCA GCGAACCGGC TTGTGTCATC GTTAAGCACG CTAACCCATG TGGTGTGGCT 
ATAGGTAGTG ATCTTCTCGA TGCCTATAAC CGTGCTTTTA AAACCGATCC GACCTCGGCC 
TTCGGTGGCA TTATCGCTTT CAATGGTGAG CTCGATGCGG CAACGGCCAG CGCGATTGTT 
GAACGCCAAT TTGTTGAAGT CATTATCGCA CCGAAAGTGA GCCAAGCCGC TCGCGATATC 
GTGGCTGCTA AAGCCAACCT TCGTCTTCTC GAATGTGGCG AGTGGAACAC TAAGACCACG 
AGCTTAGATT ATAAGCGAGT CAACGGTGGG CTGCTGCTGC AAGACAGAGA TCAAGGTATG 
GTCGGCCTGG ATGACGTGAA AGTGGTTTCT AAGCGTCAAC CCACCGCAGC CGAGATGAAA 
GATCTGATGT TCTGCTGGAA AGTGGCTAAG TTCGTTAAAT CAAACGCCAT TGTTTACGCT 
AAAGACAGCA TGACTATCGG CGTGGGCGCA GGCCAGATGA GTCGCGTATA CAGCGCGAAA 
GTGGCTGGCA TTAAGGCTGC CGATGAAGGG CTGGAAGTTC AGGATTCAGT TATGGCGTCC 
GATGCCTTCT TCCCATTCCG TGATGGTATC GATGCAGCCG CTGCTGCGGG TATCAGCTGT 
ATCATCCAAC CTGGTGGTTC GATTCGTGAT GAAGAGATCA TTGCCGCGGC AGATGAGCAC 
GGCATGGCGA TGGTATTCAC CGGAATGCGC CACTTCCGTC ATTAA

Protein sequence

MNNARPIRRA LLSVSDKTGI LEFAKSLHAQ GVELLSTGGT ARLLADNGVP VIEVSDHTGH 
PEIMDGRVKT LHPKVHGGIL ARRGIDELVM EQNNIKPIDL VAVNLYPFAE TVAKEGCTLA 
DAVENIDIGG PTMVRSTAKN HKDTTIIVNA SDYDRVIVEM NANEGSTTLE TRFDLAIAAF 
EHTAAYDGMI ANYFGTQVPA HSKDECHHDS KFPRTYNTQL VKKQDLRYGE NSHQTAAFYV 
DSPSFNGQGD EASVASAIQL QGKALSYNNI ADTDSALECV KEFSEPACVI VKHANPCGVA 
IGSDLLDAYN RAFKTDPTSA FGGIIAFNGE LDAATASAIV ERQFVEVIIA PKVSQAARDI 
VAAKANLRLL ECGEWNTKTT SLDYKRVNGG LLLQDRDQGM VGLDDVKVVS KRQPTAAEMK 
DLMFCWKVAK FVKSNAIVYA KDSMTIGVGA GQMSRVYSAK VAGIKAADEG LEVQDSVMAS 
DAFFPFRDGI DAAAAAGISC IIQPGGSIRD EEIIAAADEH GMAMVFTGMR HFRH