Gene Strop_3883 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3883
Symbol
ID	5060361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4446309
End bp	4447901
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	67%
IMG OID	640476140
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_001160691
Protein GI	145596394
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAAAC GTCGCAAGGT CTACGTCGAG GGGTCGCGGC CGGATATTCA GGTGCCGTTC 
GCCGAGGTCG ACCTGACCGG AGACAATCCG CCGGTGCGGC TCTACGACAC TTCGGGGCCG 
GGATCCGAAC CGGAGGTGGG GCTGCCGCCG ATGCGCGGCA AGTGGATCGC GTCTCGTGGG 
GACGTCGCCC CGGTGCGGGG CGCCGGTACG CCGCTGGCGG GAGTGGACGG TCAGCGGCCG 
ACCCAGCTGG CGTACGCCCG GTCGGGTGTG GTGACGCCGG AGATGGAGTT CGTGGCGATC 
CGCGAGGGGG TCGCGCCGGA GCTGGTGCGG GAGGAGATCG CGACCGGCCG GGCCGTGCTG 
CCGCTGAACG TCAACCACCC GGAGTGCGAG CCGGCGATTA TCGGCAAGGC GTTCCTGGTA 
AAGATCAATG CGAACATCGG TACCTCGGCG GTCACCTCCT CGGTCGCCGA GGAGGTGGAG 
AAGCTGACCT GGGCGACCCG GTGGGGCGCG GACGCCGTGA TGGACCTGTC GACCGGCAAG 
CGGATCCACG AAACCCGCGA GGCGGTCGTA CGGAACTCCC CGGTGCCGAT CGGCACCGTG 
CCGATCTACC AGGCGTTGGA AAAGGTGGGC GGCGATCCGG CGAAGTTGAG CTGGGAGGTG 
TTCCGGGAGA CGGTCATCGA GCAGGCCGAG CAGGGCGTCG ACTACATGAC GGTGCACGCC 
GGAGTGCTGC TGTCGTACGT GCCGCTCGCC GTGGAGCGGG TGACCGGGAT CGTCTCCCGT 
GGTGGTTCGA TCATGGCAGC ATGGTGCCTG GCCCACCACG AGGAGAACTT CCTCTACACG 
AACTTCCGGG AGCTCTGCGA GATCCTGGCC CGCTACGACG TGACGTTCTC GCTCGGCGAC 
GGGCTGCGCC CCGGCTCCAT CGCGGACGCC AACGACGAGG CGCAGTTCGC CGAACTGAGG 
ACCCTCGGTG AGCTGACGAA GGTCGCCTGG GAGCACGATG TCCAGGTGAT GATCGAGGGC 
CCGGGGCACG TACCAATGCA CAAGATCAAG GAGAATGTGG ACCTTCAGCA GGAGTGGTGT 
CACGAGGCGC CGTTCTACAC GCTCGGCCCA CTGAGTACGG ACATCGCGCC GGCGTACGAC 
CACATTACGT CCGCCATCGG CGCGGCGATG ATCGGAATGT TCGGTACGGC GATGCTCTGC 
TATGTCACCC CGAAGGAGCA CCTCGGGCTG CCGGACCGGG ACGACGTGAA GGCCGGCGTG 
ATCGCGTACA AGATCGCTGC GCATGCCGCG GACCTGGCCA AGGGGCACCC GGGGGCCCAG 
GCGTGGGACG ACGCGCTCTC CAAGGCACGA TTCGAGTTCC GCTGGGAGGA CCAGTTCAAC 
CTCGCGTTGG ACCCGGAGAC CGCGCGCGCC TACCACGACG CCACCCTGCC CGCCGAACCG 
GCGAAGACGG CCCACTTCTG TTCGATGTGC GGCCCGAAGT TCTGCTCCAT GAAAATCACC 
CAGGAGCTAA AGGAGTACGC GGCGCGTGGC ATGAAGGACA AGTCAGAGGA GTTCGTAGCC 
TCCGGCGGTC GCGTCTACCT TCCGCTGGCC TGA

Protein sequence

MQKRRKVYVE GSRPDIQVPF AEVDLTGDNP PVRLYDTSGP GSEPEVGLPP MRGKWIASRG 
DVAPVRGAGT PLAGVDGQRP TQLAYARSGV VTPEMEFVAI REGVAPELVR EEIATGRAVL 
PLNVNHPECE PAIIGKAFLV KINANIGTSA VTSSVAEEVE KLTWATRWGA DAVMDLSTGK 
RIHETREAVV RNSPVPIGTV PIYQALEKVG GDPAKLSWEV FRETVIEQAE QGVDYMTVHA 
GVLLSYVPLA VERVTGIVSR GGSIMAAWCL AHHEENFLYT NFRELCEILA RYDVTFSLGD 
GLRPGSIADA NDEAQFAELR TLGELTKVAW EHDVQVMIEG PGHVPMHKIK ENVDLQQEWC 
HEAPFYTLGP LSTDIAPAYD HITSAIGAAM IGMFGTAMLC YVTPKEHLGL PDRDDVKAGV 
IAYKIAAHAA DLAKGHPGAQ AWDDALSKAR FEFRWEDQFN LALDPETARA YHDATLPAEP 
AKTAHFCSMC GPKFCSMKIT QELKEYAARG MKDKSEEFVA SGGRVYLPLA