Gene Syncc9605_2507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9605_2507
Symbol
ID	3737922
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9605
Kingdom	Bacteria
Replicon accession	NC_007516
Strand	+
Start bp	2314474
End bp	2315490
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	43%
IMG OID	637777095
Product	ThiF family protein
Protein accession	YP_382793
Protein GI	78214014
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0476] Dinucleotide-utilizing enzymes involved in molybdopterin and thiamine biosynthesis family 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.415604
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.720809
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATTAC AACTTAAGAG ATCAATCTCA ATTAGACAAG ATCGTAACGG TGGGTTGACC 
TTTGGGATGG CACCACCACG ACACTTTATC CTGGAAAGCC CACCACCCTT TCTTGCCCTT 
CTTCTAGAGA TTCTAAATAA GCCACAATCT CTAGAAGAAG TAATTGAAAA ATTAACACAG 
GAAAACCAGA ACTGGAAGCC AAGTGAAATC AGCCAGATAT GGCAAGAATT AATTGACCTA 
AATATTCTGG AAGAGCCTAG AAAGGCTGGA AGATATGACC GTCATGAATT ATATTATGAT 
ATTTTCAATG TCAATCGCGA ACACTATGGC TGTCTGGCAG AAAAGAAGGT TGGCTTAATT 
GGAGCCGGCG GGATTGGATC CACCTGTGCA CTGCTCCTTG CCGCCGCAGG TATTGGAATT 
CTTTCACTGG CAGATGATGA CCTTTTAGAG GAAACCAATC TACCAAGAGT CGTGCTACTA 
GAAGAGCAAG ACATTGGCCT GCCTAAAATA GACCAGATCA AAGAGAGAAT CAATGCCAGA 
AATAGCGCCA CAATCATTGA AGCAACTCGG TCAAAAATTA ATGGCCCAGA CGATATTCTG 
GCATTCTTCG GAAATTGCGA TGCTTGGATA TTATCAGCAG ATACTCCAAC TCAGCTCATT 
CAAGAATGGA CAAATGCAGC CTCTCTAGAT ACCAATACAC CCTATATTTC AGCTGGGTAC 
GCTGAAATCA ATGGAATGGT AGGCCCTTTT ATAATTCCCG GCGAAACACC GTGTCATCAG 
TGTAGGATTC TCCAGGGGAA TGTTCCATCT GGCCGGCAAA TCAATAAGAA AGTACAAGCA 
ACATCTTATG GACCTCTGAA CACGATTGTT TCCGCAATGG CAGTGAATGA GGTAATCAGA 
TACCTTCTTG GTCTTGATAT AGCAACAAAA GGTACTCAAA TTATATTGAA TTCGAGCAAC 
TACAGCACGA CATTTGAGCC TCTCACATTT GCACCAGATT GCAGATGCCA TGCTTAA

Protein sequence

MQLQLKRSIS IRQDRNGGLT FGMAPPRHFI LESPPPFLAL LLEILNKPQS LEEVIEKLTQ 
ENQNWKPSEI SQIWQELIDL NILEEPRKAG RYDRHELYYD IFNVNREHYG CLAEKKVGLI 
GAGGIGSTCA LLLAAAGIGI LSLADDDLLE ETNLPRVVLL EEQDIGLPKI DQIKERINAR 
NSATIIEATR SKINGPDDIL AFFGNCDAWI LSADTPTQLI QEWTNAASLD TNTPYISAGY 
AEINGMVGPF IIPGETPCHQ CRILQGNVPS GRQINKKVQA TSYGPLNTIV SAMAVNEVIR 
YLLGLDIATK GTQIILNSSN YSTTFEPLTF APDCRCHA