Gene CPS_4049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPS_4049
Symbol	cofG
ID	3522494
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Colwellia psychrerythraea 34H
Kingdom	Bacteria
Replicon accession	NC_003910
Strand	-
Start bp	4258459
End bp	4259637
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	47%
IMG OID	637286494
Product	FO synthase subunit 1
Protein accession	YP_270706
Protein GI	71282022
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR03550] 7,8-didemethyl-8-hydroxy-5-deazariboflavin synthase, CofG subunit

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAGT TAACAGCAGT ACAGGCCAGC CAACTAGGCG ATGTTCGCGG CAAAGCGTTG 
AATACGCTCC GACAAGCCGC CTGTGCTGTG CGTGATCAAC ATTGGGGCAA GATCATGACG 
TATTCAAGAA AGGTTTTTAT TCCTCTGACC AACATGTGCC GCGATGAGTG CCAATACTGC 
ACCTTCGTTC AGCGTCCAGA ATCCGGTAAT GCAACCATCA TGACGCCGGA GCAGGTATTG 
ACCGTCATTC GTCAGGGTCA GGCAATGGGC TGCAAAGAAG TGTTGTTGAG CCTAGGTGAA 
AAACCTGAAC TACGCTATCG CGAAGCAAGA GAAGCACTCG CTGAACAAGG TTTTTCCACG 
ATGATGGAAT ACGTAGCTGA GATCAGTGCA CTAATACTGC GTGAAACCAG CCTGTTACCA 
CACGTTAATG CCGGTACTAT GACCGCTGAT GAGTTGGCAA ATATTAAAAA AGTCAGCGCT 
AGCATGGGCA TGATGCTTGA AACTGTCAGT GAACGATTAT TGCAAAAAGG ACAAGCGCAC 
TACGCCTGTC CAGACAAAGT TCCCGCTACA CGTTTGGCAA CCATCAAAAG TGCGGGCGAG 
CAGAACATTC CTTATACCAC TGGTATTTTG ATAGGTATTG GTGAAACGTG GCAGGAACGT 
GTAGAAAGTC TTGAAGCCAT TAATAATCTT CACCTCAAAT ATGGTCACAT TCAGGAAGTT 
ATCGTGCAGA ATTTTTGTGC CAAATCCGGC ACGGCCATGG CTGACCATCC AGAGCCTGAT 
CTTGAAGATA TGTTGCGGAC TTTGGCCGTC GCTCGTCTAA TGCTCGATCC GAGTATTAGT 
ATTCAGGCAC CACCAAATCT ACAACAACGC TATAAAGATT ATATCGGCAG CGGTATTAAT 
GATTGGGGTG GAATTTCGCC GTTAACCAAG GACTTTATCA ACCCAGAAAG AGCCTGGCCT 
CAAATTGAGC AATTAGCCAA GGCGACTCAG GACTGTGGTT ATCAGTTACA AGAACGCCTA 
GCTGTTTACC CTGAATATCT TAAACAACAA TATCTTAGCC CACAAATCTC AAAGCGACTC 
GAAGGTATGG CTCGCGCCGA CGGTTTAGCC TCTCAACAAT GTGTTACTGC AGAATCGGCA 
AAGCATGCCG CTGATATGAT CTACCACGTG GCCCTTTAA

Protein sequence

MDKLTAVQAS QLGDVRGKAL NTLRQAACAV RDQHWGKIMT YSRKVFIPLT NMCRDECQYC 
TFVQRPESGN ATIMTPEQVL TVIRQGQAMG CKEVLLSLGE KPELRYREAR EALAEQGFST 
MMEYVAEISA LILRETSLLP HVNAGTMTAD ELANIKKVSA SMGMMLETVS ERLLQKGQAH 
YACPDKVPAT RLATIKSAGE QNIPYTTGIL IGIGETWQER VESLEAINNL HLKYGHIQEV 
IVQNFCAKSG TAMADHPEPD LEDMLRTLAV ARLMLDPSIS IQAPPNLQQR YKDYIGSGIN 
DWGGISPLTK DFINPERAWP QIEQLAKATQ DCGYQLQERL AVYPEYLKQQ YLSPQISKRL 
EGMARADGLA SQQCVTAESA KHAADMIYHV AL