Gene Strop_4068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_4068
Symbol
ID	5060550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4626526
End bp	4627710
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	69%
IMG OID	640476329
Product	radical SAM domain-containing protein
Protein accession	YP_001160876
Protein GI	145596579
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR00423] radical SAM domain protein, CofH subfamily

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.18733
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCGGG AGATCAACGA CATCCTGCAA CGCGGCGCGG ACGGTGGGCG GATCACGCCC 
GACGAGGCCC TGCTGCTCTA CACCGAAGCG CCCTTTCACG CGCTGGGTGA GGCGGCCGAC 
GCGGTACGGC GGCGGTGGTA CCCGGACAAC ATCGTCACGT ACCTGATCGA CCGCAACATC 
AACTACACGA ACGTCTGCGT GACGGCGTGC CGGTTCTGCG CCTTCTACCG TGCGCCCAAG 
CACCGGGAGG GCTGGACCCA CCCGACCGAG GAGATCCTGC GCCGTTGCGG CGAGGCGGTT 
GAGCTGGGTG CCACCCAGGT GATGTTGCAG GGTGGGCACC ATCCCGACTA CGGGGTGGAG 
TACTACGAGG AGCTCTTCTC CTCGGTGAAG CGGGCGTACC CGCAGCTCGC CATCCACTCG 
ATCGGCCCGA GCGAGATCCT GCACATGGCG AAGGTGTCCG GCGTGGGTCT GACCGAGGCC 
ATCACCCGCA TCAAGGCGGC TGGCCTGGAC TCGATCGCGG GCGCCGGCGC CGAGATGCTG 
CCCGCCCGGC CGCGGAAGGC GATCGCGCCG CTGAAGGAGT CCGGGGAGCG CTGGCTCGAG 
GTGATGGAGC TCGCCCACCA GCAGGGCGTC GAGTCGACCG CGACGATGAT GATGGGAACC 
GGTGAGACCG CCGCTGAGCG GATCGAGCAC CTCCGGATGA TCCGCGACGT GCAGGACCGG 
ACGCGGGGCT TCCGGGCGTT CATCCCGTGG ACCTACCAGC CGGAGAACAA CCACCTCAAG 
GGCCGGACCC AGGCCACCAC CCTGGAGTAC CTGCGGTTGG TGGCGGTGTC CCGGCTCTTC 
TTCGAGACGG TGCCGCACCT CCAGGCGTCG TGGCTCACCA CCGGCAAGGA TGTCGGCCAG 
CTCGCGCTGC ACATGGGGGT TGACGATCTG GGCTCGATCA TGCTGGAGGA GAACGTCATC 
TCCTCGGCGG GCGCGAGGCA CCGTTCGAAC CTGCACGACC TGATCGGAAT GATCCGCTCG 
GCGGACCGGA CCCCCGCCCA GCGGGACACC CACTACCGCC GGCTCGCTGT GCACCACACT 
CCCGCGGACG ACCCGCGGGA CGACCGGGTG GTGTCGCACT TCTCGTCGAT TGCCCTGCCA 
GGCGGTGGCG CCGGGAAGAC GCTGCCACTG GTCGACGCCG GCTGA

Protein sequence

MSREINDILQ RGADGGRITP DEALLLYTEA PFHALGEAAD AVRRRWYPDN IVTYLIDRNI 
NYTNVCVTAC RFCAFYRAPK HREGWTHPTE EILRRCGEAV ELGATQVMLQ GGHHPDYGVE 
YYEELFSSVK RAYPQLAIHS IGPSEILHMA KVSGVGLTEA ITRIKAAGLD SIAGAGAEML 
PARPRKAIAP LKESGERWLE VMELAHQQGV ESTATMMMGT GETAAERIEH LRMIRDVQDR 
TRGFRAFIPW TYQPENNHLK GRTQATTLEY LRLVAVSRLF FETVPHLQAS WLTTGKDVGQ 
LALHMGVDDL GSIMLEENVI SSAGARHRSN LHDLIGMIRS ADRTPAQRDT HYRRLAVHHT 
PADDPRDDRV VSHFSSIALP GGGAGKTLPL VDAG