Gene Huta_1304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_1304
Symbol	cofG
ID	8383581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	+
Start bp	1276479
End bp	1277585
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	66%
IMG OID	644972365
Product	FO synthase subunit 1
Protein accession	YP_003130213
Protein GI	257052380
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR03550] 7,8-didemethyl-8-hydroxy-5-deazariboflavin synthase, CofG subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.366684
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCCGAA ACCCGGACGT GATCCCCGGG GCCGAGGAAT ACGACGTCGA CGTCACGATC 
GATCCGGCCG AGCGCGAGCG ACTGCTGTCG GTCGGCCCCG AGGACGTCGC CGGACCCGGC 
GAGGACGGCG GCCCCGACCA CCTCTCCTTT GCCAGAAATG TCTTCATCCC ATTGACGACG 
GCCTGCCGGT ACACCTGCAC CTACTGTACG TACTACGATC CGCCGGGCCA GGCCTCGTTG 
CTTTCGCCCG AAGACGTCCG CGAGATCTGC CGGGAGGGGG CCGACGCCGG CTGTACGGAA 
GCCCTCTTTA CCTTCGGCGA CGATCCCGAC GACCGCTACG ACGCAATCTA CGACCAACTC 
GCCGAGTGGG GCCACGACTC GATTCACACC TATCTCCGGG AGGCCTGCGA GATCGCGCTG 
GAGGAGGGAC TGCTGCCCCA CGCCAATCCG GGCGATCAGA CCCGCGAGCA GATGGCCGAA 
GTCGCCGATC TGAACGCGAG CATGGGTGTG ATGCTAGAGA CAACCGCCGA TCTTGAGGCC 
CACTCGGGTT CGCGCCGCAA AGAGCCGGGC CAACGACTCG CAACGATCCG GACGGCAGGG 
GAACTCGGCG TGCCTTTCAC AACCGGGATT CTGGTCGGCA TCGGCGAGGA CTGGGCGGAT 
CGCGCCGAGA GCCTGCTGGC AATCGCTGCC CTCCACGAGC GGTACAACCA CGTCCAGGAG 
GTGATCGTCC AGCCCGTTTC GCCGAACGAA CGCTGGGATC GCGAGCCGCC GAGTCTGGAG 
ACGATGCGCC GGACGGTCGC GATGGCACGG GCGGGATTGC CAGAGACGGT CAGCGTCCAG 
GTCCCGCCGA ATCTGGCCCG GACGCGCGAC CTGCTCGACT GCGGCGTCGA CGATCTTGGC 
GGTGTCTCCC CGGTCACCGA TGACCACGTC AATCCCGACT ACGCCTGGCC GGCACTGGAC 
GAACTCCGCG CGATCGCAGA CGATGCGGGT GTCCCGCTAC GCGAGCGGTT ACCGGTCTAC 
GATCGCTACG TGGACGAAGA CTGGCTGAGC GAGCAGGTAT TGGCAACGGT CTCGACAGTG 
ACATCGACGG ACGAAACAGG GACCTGA

Protein sequence

MIRNPDVIPG AEEYDVDVTI DPAERERLLS VGPEDVAGPG EDGGPDHLSF ARNVFIPLTT 
ACRYTCTYCT YYDPPGQASL LSPEDVREIC REGADAGCTE ALFTFGDDPD DRYDAIYDQL 
AEWGHDSIHT YLREACEIAL EEGLLPHANP GDQTREQMAE VADLNASMGV MLETTADLEA 
HSGSRRKEPG QRLATIRTAG ELGVPFTTGI LVGIGEDWAD RAESLLAIAA LHERYNHVQE 
VIVQPVSPNE RWDREPPSLE TMRRTVAMAR AGLPETVSVQ VPPNLARTRD LLDCGVDDLG 
GVSPVTDDHV NPDYAWPALD ELRAIADDAG VPLRERLPVY DRYVDEDWLS EQVLATVSTV 
TSTDETGT