Gene Hlac_1894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1894
Symbol	cofG
ID	7400088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1895054
End bp	1896217
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	71%
IMG OID	643708965
Product	FO synthase subunit 1
Protein accession	YP_002566542
Protein GI	222480305
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR03550] 7,8-didemethyl-8-hydroxy-5-deazariboflavin synthase, CofG subunit

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.373224
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTCGCAG CCGCCGAGGA GTACGGGATC GAGATCGAGC CCGACCCCGA ACGGGTCGAG 
CGACTGCTCT CGATCACCCC CGCCGACGTC GAGCCCGCCG ACCGGCTCAC CTTCGCGCGG 
AACGTCTTCG TCCCGCTGAC GACCGCCTGC CGGTACACCT GCACGTACTG CACCTACTAC 
GACGTGCCCG GCGAGGCGTC GTTGCTGTCT CCCGAGGAGG TCCGGCAGCG GTGTCGCGTC 
GGGGCCGACG CCGGCTGCAC GGAGGCGCTG TTCACCTTCG GCGACGAGCC CGACGACCGG 
TACACAGCGG TCCACGATCA GCTCGACGAG TGGGGATACG ACTCGATTCT GGAGTACCTC 
TACCGTGCCT GCGAGATCGC GTTAGAGGAG GGACTGCTCC CGCATTCGAA CCCCGGTGAT 
CTCACGGAGG CGGCGTTTGC GGACCTCCGC GAGGTGAACG CCTCGATGGG CGTCATGCTG 
GAGACGACCG CCGACGTCGA CGCCCACAGC GGCGGTCGCC GGAAGACCCC GGGCCAGCGG 
CTCAACACGA TCCGCGCCGC GGGCCGGCAG GGTGTGCCCT TCACCACCGG CATCCTCCTC 
GGTATCGGCG AGGACTGGCG CGACCGCGCG GAGAGCCTGC TCGCGATCCG GGAGATCCAC 
GAGCGACACG GCCACGTCCA AGAGGTGATC GTGCAGAACG TCGTCCCGAA CGAGCGATCG 
GACTTCGAAA AGCCCGATCT GGCGACGATG CGCCGGGTCG TCGCGATGGC GCGGGCCGCG 
CTCCCCCCCG AAGTGTCGGT CCAAGTGCCG CCGAACCTCT CGCCCGCGGC CGACCTCGTC 
GACTGCGGGA TCGACGACCT CGGCGGCGTC TCCCCCGTCA CCGACGACTA CGTCAACCCG 
GACTACGCGT GGCCCGACCT CGACGGCCTC CGGACGGTCG CCGACGCGGG CGGGATGCCG 
CTTCGCGAGC GCCTCCCGAC CTACGCCCGA TTCCTCCCCG ACGGGCTCAG GCCCTCGGAC 
ACGGAGCCTG CCGCGCCTCC GGCCGGCCGC GACGCGTGGA TCCCGCCGGC GGTCCGCGAC 
CGGATGCGCG CGGACGACCC GCACGGGCGA CGGCTCCGTG GCGTCGCGCG TGGCGACGGC 
CCGCTCGCGG TCCGTGGGGA TTGA

Protein sequence

MFAAAEEYGI EIEPDPERVE RLLSITPADV EPADRLTFAR NVFVPLTTAC RYTCTYCTYY 
DVPGEASLLS PEEVRQRCRV GADAGCTEAL FTFGDEPDDR YTAVHDQLDE WGYDSILEYL 
YRACEIALEE GLLPHSNPGD LTEAAFADLR EVNASMGVML ETTADVDAHS GGRRKTPGQR 
LNTIRAAGRQ GVPFTTGILL GIGEDWRDRA ESLLAIREIH ERHGHVQEVI VQNVVPNERS 
DFEKPDLATM RRVVAMARAA LPPEVSVQVP PNLSPAADLV DCGIDDLGGV SPVTDDYVNP 
DYAWPDLDGL RTVADAGGMP LRERLPTYAR FLPDGLRPSD TEPAAPPAGR DAWIPPAVRD 
RMRADDPHGR RLRGVARGDG PLAVRGD