Gene Synpcc7942_0396 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_0396
Symbol	purH
ID	3774917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	+
Start bp	389953
End bp	391494
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	57%
IMG OID	637798802
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_399415
Protein GI	81299207
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCGAT TTGCCCTGCT CAGTGTTTCC GATAAAACTG GCCTCGTTGA TTTTGCACGT 
CAACTGGTCG ATCGCTTTCA GTTTCAGATT GTCAGTAGCG GTGGCACCGC CAAGCAACTC 
CTAGAAGCAG GTATCCCCGT TACGAAAGTT GCAGAACACA CGGGCTCACC CGAAATCCTC 
GGTGGCCGAG TCAAAACCTT GCATCCCCGC ATTCATGGCG GCATTTTGGC GCGCCGCGAT 
CGCGAAGAGG ATCAAGCAGA TTTAGCGGCC AACAACATTC AGCCGTTTGA CTTAGTCGTC 
GTCAATCTCT ATCCCTTCGA GGCCACGATC GCCCGTCCTG AAGTGACGCT GGCAGATGCG 
ATCGAGCAAA TTGACATCGG CGGGCCAGCA ATGGTGCGGG CCTCGGCCAA GAACCATGCT 
CACCTAACGA TTCTGACTAA CCCCAGCCAG TACGAGCCCT ATCTGACGGC CCTGGCCGAT 
GGAGAGGGAC AAATTCCCCT CGCGTTCCGC CAGCAGTGCG CTCTAGCGGC TTTCCAGCAC 
ACCGCTGCTT ATGATGCGGC GATCGCGACT TATCTCGCTG AGCAATTTGA AGCGACCAGC 
GATCGCTTGC AACTGAGTGC TCAGCCGGTG CAAGTCCTGC GCTACGGCGA AAACCCCCAC 
CAGGCGGCGA CTTGGTATCA AACCGGTGCT ACGGCCAGCG GTTGGGCAGC GGCGCAGCAA 
CTACAGGGCA AAGAGCTGAG CTACAACAAC CTAGTTGACC TCGAGGCAGC ACGCCAAATT 
ATTGCGGAGT TCCCGGCGGA TGGCCCCGCT GCTGCCGCGA TTCTCAAACA CAATAATCCC 
TGCGGAGTCG CCACAGCTGA GGCATTGAGT GATGCCTATC AAAAAGCGTT TGACGCGGAC 
TCCGTCTCTG CTTTCGGGGG CATTGTGGCC CTGAATCGGG CGATCGATGC GGCAACTGCA 
ACGGCGATGA CCGGCACCTT CCTCGAATGT ATTGTTGCCC CATCGGTTGA GCCAGCAGCG 
GCTGAGATTC TCGCAGCTAA GAAAAACCTA CGGGTACTCA CCCTGGCAGA TTTCAATAGC 
GGTCCGCAGC AAACTGTGCG ATCGATCGCC GGCGGATTCT TGGTGCAGGA CAGCGATGAT 
CAGCTGGAAA CCGTTGATGC TTGGCAGGTC GTCACGGAAC AGCAGCCTAG CGAAGCCGAT 
TGGCAGGAGT TGCTGTTTGC TTGGAAGGTG GTCAAACATG TCAAATCCAA TGCGATCGCG 
GTGACGGCGA ATGGCGTCAC GCTCGGGATT GGTGCCGGTC AAATGAATCG GGTCGGTTCC 
GTCAAAATTG CCTTGGAACA AGCGGGCGAT CGCGCTCAAG GTGCCATTCT TGCCAGCGAT 
GGTTTCTTTC CCTTTGATGA CAGTGTTCGT ACCGCAGCGG CAGCTGGAAT TCGGGCGATC 
GTGCAACCCG GCGGGAGTCT GCGTGATGCT GATTCAATTG CAGCGGCGAA CGAACTTGGC 
CTTGTGATGG TCTTTACTGG CACGCGCCAC TTCCTCCACT AA

Protein sequence

MPRFALLSVS DKTGLVDFAR QLVDRFQFQI VSSGGTAKQL LEAGIPVTKV AEHTGSPEIL 
GGRVKTLHPR IHGGILARRD REEDQADLAA NNIQPFDLVV VNLYPFEATI ARPEVTLADA 
IEQIDIGGPA MVRASAKNHA HLTILTNPSQ YEPYLTALAD GEGQIPLAFR QQCALAAFQH 
TAAYDAAIAT YLAEQFEATS DRLQLSAQPV QVLRYGENPH QAATWYQTGA TASGWAAAQQ 
LQGKELSYNN LVDLEAARQI IAEFPADGPA AAAILKHNNP CGVATAEALS DAYQKAFDAD 
SVSAFGGIVA LNRAIDAATA TAMTGTFLEC IVAPSVEPAA AEILAAKKNL RVLTLADFNS 
GPQQTVRSIA GGFLVQDSDD QLETVDAWQV VTEQQPSEAD WQELLFAWKV VKHVKSNAIA 
VTANGVTLGI GAGQMNRVGS VKIALEQAGD RAQGAILASD GFFPFDDSVR TAAAAGIRAI 
VQPGGSLRDA DSIAAANELG LVMVFTGTRH FLH