Gene Strop_0601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_0601
Symbol
ID	5057042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	680912
End bp	682120
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	66%
IMG OID	640472871
Product	HEAT repeat-containing PBS lyase
Protein accession	YP_001157459
Protein GI	145593162
COG category	[C] Energy production and conversion
COG ID	[COG1413] FOG: HEAT repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACTCC AATCCATCGG TCTGTCCACC GGGGGCCGGG ACCGCGCGCC AGAGTGGGAG 
CACTACCTCA AGGGTGACCC GGCGCTGTTG AACAGCGAGC TCGGCGACAT CCTGGACCGG 
GATGCGGTGC GGCTCGACAT CCGCACCGAC GACCAGGTCG CGTACGAGGC GCTGCACCAC 
CCGGACCCGA TGGTCCGCGA GCAGTCCCTG TACCAGGCGA TGGACCGCCG GTTGCCGGAA 
GCGATCGACC TGATCGCGGA AAGCATCGCC ACCGATGAAA ACCGCGAGGT GCGGTGGAAC 
GCACTGTGGG CGCTGGAAAA GATCGGCGGG CCGCGGGCCC TACAGATCAT CGAACGGCAC 
GTCAACGACG ACGACGCCGA CGTCGGCGAG TGGGCACAAC TGTTTAGCTC CGAGCTGCGC 
ACCGGCCTGC CTGCCTTCGA CAACCGGTCG TTCGCCTGGG ACAGCGACCG GACCTTCGAC 
GAGACGATTC TGCTCAACAT CCACTGTGAC GTCTACGTTG CACTGGATGA GACGGGACGC 
AACTGGGGGA AGATCTCCCT GGCGCCCCAG GGCTTGGCCC GCAGCTACGG TCAGGCGCAC 
GCGTGCCCGA ACACGGACAC CCGTAACCAG AAGCTCATCA TCAGCAAGAC ACTGTCCGGC 
CTGCATGAGG ACGGAACGCC GCACACGGAG AACTTCGTGT TCCGGGGGCT CACAAACCAC 
GCCAACGCCG GCCGCGGCAG CTTCTACTTC GAGTCACGCG GTCTGCGGCC GATCTTCCTA 
TCCGGCCGCG CCGACGACGA CAGCCTGGGA CACCGCAACG AGATGGTCGC CGCCAAGCGC 
AGTGGCGAGT GGACCCTCGA CCCGAGGATC CAGATCAGGG GCGAGTCGGC GATCCGCTAC 
GTCCGGGGTC GGGTGCACAC CTGGGGCTAC GTCAACTTCG ACACCATGGC GGGCAGCTCG 
CTGGAGGAGG TGCTGTTCCC CGGCAACAGC ATCCTCGGCA CGCTGGACAC CCCCACCGGG 
CCGCTGGCGA ACGCGTTCAT CGTGGGCACG TTCAAGGGCA AGCTGGTCGA CTGGGATGGC 
GACGACAAGG TCAATGTCAA CTCGCTCGAC ATCTACTCGA CGCTGGACGG GGACGTCGAC 
TCCGACCAGG ACGGCGTCGC CGACATCCCG GGGGTGCAGT TCTGCCCCCG TACCAACTGG 
ATGAACTGA

Protein sequence

MTLQSIGLST GGRDRAPEWE HYLKGDPALL NSELGDILDR DAVRLDIRTD DQVAYEALHH 
PDPMVREQSL YQAMDRRLPE AIDLIAESIA TDENREVRWN ALWALEKIGG PRALQIIERH 
VNDDDADVGE WAQLFSSELR TGLPAFDNRS FAWDSDRTFD ETILLNIHCD VYVALDETGR 
NWGKISLAPQ GLARSYGQAH ACPNTDTRNQ KLIISKTLSG LHEDGTPHTE NFVFRGLTNH 
ANAGRGSFYF ESRGLRPIFL SGRADDDSLG HRNEMVAAKR SGEWTLDPRI QIRGESAIRY 
VRGRVHTWGY VNFDTMAGSS LEEVLFPGNS ILGTLDTPTG PLANAFIVGT FKGKLVDWDG 
DDKVNVNSLD IYSTLDGDVD SDQDGVADIP GVQFCPRTNW MN