Gene Syncc9902_1098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_1098
Symbol
ID	3743312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	-
Start bp	1058147
End bp	1059718
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	56%
IMG OID	637771274
Product	bifunctional 3,4-dihydroxy-2-butanone 4-phosphate synthase/GTP cyclohydrolase II/unknown domain fusion protein
Protein accession	YP_377106
Protein GI	78184671
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II [TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0688555
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCATTC GCAATGGAGC CTGCGTGGTC GTCGTGGACG ACGAGCAACG TGAAAATGAA 
GGAGATCTAA TTTGTGCTGC CCAGTTCGCC ACCCCAGAAG CGATCAACTT CATGGCAACG 
GAAGCCAGAG GATTGATCTG TCTCGCTATG GAGGGAGACC GGCTCGATGA ACTGGACCTT 
CCACTCATGG TGGATCGCAA TACGGATGCC AATCAAACAG CCTTCACCGT CAGCATCGAC 
GCTGGTATTG AACATGGCGT CACCACTGGA ATTTCAGCGG ACGATCGGGC TCGCACCATT 
CAAGTTGCTC TCAACCCGTC AACACGCCCT GCAGATCTCC GCCGTCCAGG CCATATCTTC 
CCCCTCCGTG CACGCTCCGG GGGCGTCCTA AAGCGTGCAG GTCATACGGA GTCGGCTGTT 
GATTTATCCC TGTTGGCTGG CCTGAGCCCA GCTGGTGTCA TTTGTGAAAT TCAGAACACC 
GACGGCTCCA TGGCACGGCT GCCAGAGCTC AGGGCCTATG CCGACCAATG GGGCTTAAAA 
CTCATCAGCA TTGCCGATCT GATTCGCTAC AGACTTGAAA ACGAGCGTTT CGTCAAGCGG 
CTAGCGCACG CCGAACTCCC CAGTCAGTTC GGCGCATTTC AAGCGATCGG CTACAAAAAT 
GATCTCGATG GTTCGGAACA CGTTGCCCTG GTGAAAGGAG ATCCAGCGTC TTTGAAAGAA 
CCGGTTCTGG TGCGAATGCA CTCGGAATGC CTCACCGGTG ATGCTTTCGG ATCACTGCGC 
TGCGACTGTC GTCCCCAACT CGAGGCGGCG CTTCGCCAGA TCGAAGCCGA GGGAGAAGGC 
GTCGTGGTTT ATCTGCGACA GGAGGGACGC GGCATCGGCT TGATCAACAA ACTGAGGGCC 
TACAGCCTTC AGGACGGTGG ACTGGACACC GTTGAAGCGA ATGAGCGATT GGGTTTTCCC 
GCCGACCTGC GCAATTACGG GGTTGGAGCA CAAATTTTGT CCGACCTTGG AATCCACAGG 
TTGCGCCTAC TCACCAACAA TCCACGCAAA ATTGCTGGAT TGGGTGGATA CGGACTGCAG 
GTGGAAGAAC GCGTCCCCCT TGTGATGGAT GCAGGAGACC ACAATGCCGA TTATCTCGCT 
GCCAAGCGAG ACAAACTTGG CCACTTACTT GAGGCAGATA CGCCTTGCAC CGTGTTGGCC 
ATGGCGGTTC ACGGGCAACC TGACACCTGG CCACAGGTGC GTCGACAGGT CGAGTCAGTG 
GCGCACGAAC ATGGATTTCA AATGGATGCG CTCCATGAAC CAAGGCTGCT CGCCCTTTGG 
GACAGACCGC AATTCGTTTG GAAAATCAAG CCTGGTGATC AGGATCCATA CCAGTTAATC 
CAAGCGTTGG CGAAGGTATC GAGCACGAAG GCCTTGGGCC TCATGCGCGT TCCCAGCGAG 
CGGATGGCAC TTCACCCACC CCAAACATTG GAACGCCTCG ATCGAGACCT CTCAGAATTG 
GAGTCGGATC AGAGGGCTGG CCTGATCCAG ACCAGCCCGG TGTTGTTGTT TTGGCGTCAA 
GGACAACAAT GA

Protein sequence

MAIRNGACVV VVDDEQRENE GDLICAAQFA TPEAINFMAT EARGLICLAM EGDRLDELDL 
PLMVDRNTDA NQTAFTVSID AGIEHGVTTG ISADDRARTI QVALNPSTRP ADLRRPGHIF 
PLRARSGGVL KRAGHTESAV DLSLLAGLSP AGVICEIQNT DGSMARLPEL RAYADQWGLK 
LISIADLIRY RLENERFVKR LAHAELPSQF GAFQAIGYKN DLDGSEHVAL VKGDPASLKE 
PVLVRMHSEC LTGDAFGSLR CDCRPQLEAA LRQIEAEGEG VVVYLRQEGR GIGLINKLRA 
YSLQDGGLDT VEANERLGFP ADLRNYGVGA QILSDLGIHR LRLLTNNPRK IAGLGGYGLQ 
VEERVPLVMD AGDHNADYLA AKRDKLGHLL EADTPCTVLA MAVHGQPDTW PQVRRQVESV 
AHEHGFQMDA LHEPRLLALW DRPQFVWKIK PGDQDPYQLI QALAKVSSTK ALGLMRVPSE 
RMALHPPQTL ERLDRDLSEL ESDQRAGLIQ TSPVLLFWRQ GQQ