Gene Psyc_1472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Psyc_1472
Symbol	purH
ID	3515433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Psychrobacter arcticus 273-4
Kingdom	Bacteria
Replicon accession	NC_007204
Strand	+
Start bp	1788784
End bp	1790364
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	47%
IMG OID	637670161
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_264754
Protein GI	71066027
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.255919
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.00000132318
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAGTAAAG CCCCACTTGC ACTACTGTCA GTCTCCGATA AATCTAATAT CGTTGAATTC 
GCCCAAGGTC TGATTCAGGC AGGGTTTGGT TTGTTATCGA CTGGCGGTAC TTTCCGTTTG 
CTAACAGAGC ATAATGTCGC TGTCACCGAA GTATCAGATT ACACGGGTTT TCCTGAGATG 
ATGGATGGTC GGGTTAAAAC ACTTCATCCC AAGATCCACG GTGGCATTTT GGGACGCCGC 
GGTACAGATG ATATGGTGAT GAGTGAGCAT GCGATTGAAC GCATTGATTT GGTCGTTGTC 
AACCTCTATC CATTTGCAGA AACGATTGCA CGTAGTGACG TTACCATGAA TGATGCCATC 
GAAAATATCG ATATTGGCGG ACCTACTATG GTGCGTTCAG CGGCAAAGAA TCATGCACAC 
GTTGGTATTG TGACTGATCC AGCTGATTAT ACGCGAGTAC TTGAAGCATT AGGCGACAGT 
ACTGCATTGA CCGCTACCCT ACGTTACGAC CTAGCGGTTA AAGCATTTGA GCATACTGCA 
CAATATGACG GGATGATTGC AAACTTTTTG GGTAGCCGTG TTAATGAGAG CCAAGAGCCT 
GAGAGTTTTT CACGTACCTT TAACGTTCAG CTAGAAAAAG TGCAAGACCT TCGCTACGGT 
GAAAACCCGC ATCAAAAGGC GGCGTTCTAT GTTGAAAATA ACTCTTCAAA AAGCAAGCAA 
GCATCTATTG CTACTGCTAA GCAATTGCAA GGCAAAGCCT TGTCTTATAA CAATATCGCC 
GATACTGATG CCGCGCTTGA ATGCGTTAAA GCCTTTAGCA CGCCTGCTTG TGTGATTGTA 
AAGCATGCCA ACCCTTGTGG CGTTGCTGTA GATATCGATC AAGTAGCAGC ATATCGCACT 
GCCTTCAGTA CCGATCCTGA GTCTTCTTTT GGCGGTATCA TCGCTTTTAA CCGCCCGTTA 
ACCCTTGCAG CCGCTACAGC CATTATCGAC AATCAGTTTG TTGAAGTCAT TATTGCCCCA 
AGTGTCGAAG ACGGTGTGTT AGAGGCGACT GCTTCGAAGA AAAACGTTCG CGTCTTGGTT 
TGCGGCGATT TGCCAGCACC TGAGCTACGT GACCGTCAGC TTGATTATAA GCGTGTGAAT 
GGTGGTTTGC TGGTGCAAGA GCAAGATTTG GGCTTGATTA CGGCTCACGA CTTAAAAATC 
GTCACAGACG TGCAGCCAAC CGAAGCGCAG ATTGCTGATT TACTATTTAG CTGGAACGTT 
GCAAAATACG TTAAATCTAA TGCCATCGTT TACGCTAAAG GTCAGCGTAC CATCGGTGTA 
GGTGCAGGTC AGATGAGCCG TGTTAACTCA GCTCGTATCG CTGCTATTAA AGCGGAGCAC 
GCTGGACTTG CAACCGAAGG CGCGGTTATG GCATCTGATG CCTTCTTCCC GTTCCGTGAT 
GGTATCGACA ATGCAGCAGA AGTGGGTATT GCTGCGATTA TCCAACCAGG TGGTTCTATG 
CGCGATGATG AGACCATCGC TGCCGCAAAT GAGCACGGTA TCGCCATGGT CTTCACCGGT 
ATGCGTCATT TCCGTCATTA A

Protein sequence

MSKAPLALLS VSDKSNIVEF AQGLIQAGFG LLSTGGTFRL LTEHNVAVTE VSDYTGFPEM 
MDGRVKTLHP KIHGGILGRR GTDDMVMSEH AIERIDLVVV NLYPFAETIA RSDVTMNDAI 
ENIDIGGPTM VRSAAKNHAH VGIVTDPADY TRVLEALGDS TALTATLRYD LAVKAFEHTA 
QYDGMIANFL GSRVNESQEP ESFSRTFNVQ LEKVQDLRYG ENPHQKAAFY VENNSSKSKQ 
ASIATAKQLQ GKALSYNNIA DTDAALECVK AFSTPACVIV KHANPCGVAV DIDQVAAYRT 
AFSTDPESSF GGIIAFNRPL TLAAATAIID NQFVEVIIAP SVEDGVLEAT ASKKNVRVLV 
CGDLPAPELR DRQLDYKRVN GGLLVQEQDL GLITAHDLKI VTDVQPTEAQ IADLLFSWNV 
AKYVKSNAIV YAKGQRTIGV GAGQMSRVNS ARIAAIKAEH AGLATEGAVM ASDAFFPFRD 
GIDNAAEVGI AAIIQPGGSM RDDETIAAAN EHGIAMVFTG MRHFRH