Gene Syncc9605_0123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9605_0123
Symbol
ID	3737248
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9605
Kingdom	Bacteria
Replicon accession	NC_007516
Strand	+
Start bp	119212
End bp	120666
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	61%
IMG OID	637774702
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_380454
Protein GI	78211675
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0039044
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGATCCACG GCCAAACGTC GACCCCTGGG CTGTCCGTCG CACCTCAGAT CATGCGCGCT 
TCCTGGGTTG AGTCCCGCAA GGGTCAGGCC AACGTCTCTC AGATGCACTA CGCCCGTCAG 
GGCGTGGTGA CCGAAGAAAT GGCTCATGTG GCGAAGCGGG AGAACCTGCC CGAATCGCTG 
GTGATGGAAG AGGTGGCCCG GGGGCGGATG ATCATCCCGG CCAATATCAA CCACACCAAT 
CTGGAGCCGA TGGCAATCGG CATCGCCAGC AAGTGCAAGG TGAACGCCAA CATCGGCGCC 
TCTCCAAATG CGTCCGATGC CGCTGAGGAG GTGAAAAAGC TCAAGCTGGC GGTGAAGTAC 
GGCGCTGACA CCGTGATGGA TCTTTCCACT GGCGGCGTCA ACCTCGATGA GGTGCGCACC 
GCAATCATCG GTGCATCTCC CGTGCCGATC GGCACCGTGC CTGTTTATCA GGCTCTTGAG 
AGCGTCCACG GATCGATCGA GAAGCTCGAT GAGGACGACT TCCTCCACAT CATTGAGAAG 
CACTGTCAGC AGGGCGTCGA CTACCAGACC ATCCACGCTG GCCTGCTGAT TGAGCACCTT 
CCCAAGGTGA AGGGCCGCAT CACCGGCATC GTCAGCCGCG GCGGCGGGAT CCTGGCTCAA 
TGGATGCTGT ATCACCACCG TCAAAACCCG CTCTACACGC GGTTTGACGA CATCTGCGAG 
ATCTTCAAGC GCTACGACTG CACCTTCTCC CTCGGTGACT CGCTGCGCCC CGGTTGCCAG 
CACGATGCGT CGGATGCTGC TCAACTGGCT GAATTGCACA CCCTCGGTGA ACTGACCCGT 
CGCGCCTGGA AGCACGACGT GCAGGTGATG GTGGAGGGTC CCGGCCACGT TCCCCTCGAT 
CAGATCGAGT TCAACGTGAA GAAGCAGATG GAGGAGTGCA GCGAAGCACC CTTCTATGTG 
CTCGGCCCCC TGGTCACTGA CATTGCTCCC GGCTACGACC ACATCACTTC GGCCATCGGC 
GCGGCGATGG CCGGTTGGCA TGGCACGGCG ATGCTCTGTT ATGTGACGCC GAAGGAGCAC 
CTCGGTCTGC CCAACGCTGA TGATGTGCGC GAAGGCCTGA TCGCTTACAA GATCGCTGCC 
CATGCGGCAG ATATTGCCCG CCATCGCCCC GGCGCCCGGG ACCGTGACGA CGAGCTCAGC 
CGCGCCCGCT ACAACTTCGA TTGGAACAAG CAGTTTGAGC TGTCCTTGGA TCCTGAGCGG 
GCCAAGGAGT ATCACGACGA AACCCTGCCG GCTGACATCT ACAAGCAGGC TGAGTTCTGC 
TCCATGTGCG GACCGAAGCA CTGCCCGATG CAGACCAAGA TCACTGATGA AGATCTTGAG 
GGTCTGGAGA AGGTGCTCGA AGCCAACACC GGCGCTGCAG AGCTGACGCC GGTCAAACTC 
GACAAAGCCG ATTGA

Protein sequence

MIHGQTSTPG LSVAPQIMRA SWVESRKGQA NVSQMHYARQ GVVTEEMAHV AKRENLPESL 
VMEEVARGRM IIPANINHTN LEPMAIGIAS KCKVNANIGA SPNASDAAEE VKKLKLAVKY 
GADTVMDLST GGVNLDEVRT AIIGASPVPI GTVPVYQALE SVHGSIEKLD EDDFLHIIEK 
HCQQGVDYQT IHAGLLIEHL PKVKGRITGI VSRGGGILAQ WMLYHHRQNP LYTRFDDICE 
IFKRYDCTFS LGDSLRPGCQ HDASDAAQLA ELHTLGELTR RAWKHDVQVM VEGPGHVPLD 
QIEFNVKKQM EECSEAPFYV LGPLVTDIAP GYDHITSAIG AAMAGWHGTA MLCYVTPKEH 
LGLPNADDVR EGLIAYKIAA HAADIARHRP GARDRDDELS RARYNFDWNK QFELSLDPER 
AKEYHDETLP ADIYKQAEFC SMCGPKHCPM QTKITDEDLE GLEKVLEANT GAAELTPVKL 
DKAD