Gene Strop_1289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1289
Symbol
ID	5057742
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	1448267
End bp	1449598
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	72%
IMG OID	640473561
Product	Allergen V5/Tpx-1 family protein
Protein accession	YP_001158137
Protein GI	145593840
COG category	[S] Function unknown
COG ID	[COG2340] Uncharacterized protein with SCP/PR1 domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.323784
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTACGGCT GGAACGACCC GAGGAACCCA GACGGTAGCC GTCGGCAACC CGAACCGGCG 
GCCGATGAAC CAGCGTGGCC GACAGACCGC CCGGAGCCAC GCTCCGCCTA CCTGTTCGGT 
GACGAGCCGG ATGGACCTCC TCACCGATGG GAGCCCACCG ACCGACGGGA GCAGCCCACC 
GACGAGTGGG ACCGACAGCA GCCGACCGCG CACTGGCGGT CGGACGCCGA GCCCGCGCGA 
GGCTGGGGAG CCGCGGAGCA CCCGTACCAC GGTCCCGTCG GTGACCCCTA CCACGAACAG 
CCCACGCAGG GCTGGGAAGC CACCCCGACC TGGCAGCACG GAGAGCCCAC CCAGAACTGG 
CAGCGGGAGC AGCCGGGCGA CCGGCCCGAC CAGCGGTTCG CGGGCGGACG GAACGAGCCC 
ACCGGTAGCT GGCACGGCGC GGCCACCCCC ACCGGCGGGC CCGAGCCCAC CGGCCAGTGG 
CAGGCCCCGG AGCCGACCGG CTGGTACGCC GACGAACCAA CGACCAGCAT GCCGTCCCTC 
GCGGAAGCCG CAGCCGCCGG TGACGTGCCC GCCGGCGAGG ATCGGCCCCG TCGTCGGCAC 
CGGCGACCGC TGCTCATCGG CGGAGCCGCG GCGGCAGCCA CACTGGTGGT GAGCCTCGGG 
GTCGGCGCCG TTACCTTCGC CGGTGGCGGT GACGCCAGCC CCACCTCGGC CATCGACGAC 
ATCGTGGCGA CGAACCCGAC CGAGGAGAGT GCGTTTCCCA GCGGCACGCC GACCTCGGCC 
AGCCCCAGCG CCACGCCGAC CACGACGTCG CCATCACCGT CACCGTCGGT CACGCCGAGT 
CGCAAGCCGA GCCCGACGGC CTCGCGCTCC ACCGCCGCCC CCCGGCCCAC CCCGAACCGC 
ACCACCGCGC CCCCCACCAA CAGCACCACC GCGCCCGCCA ACGGCAACGT CAGCGAAGAC 
GCGGCCGAGG TGGTTCGGCT GGCCAACATT GAGCGCAAGG AGGCCGGCTG CGCGGCGTTG 
AGCATCGACG ACAAGCTGAT GACCGCAGCC CAGCGGCACA GCCAGGACCA GGCCGACAAC 
CGGAAGATGT CACACGACGG CAGCAACGGC AGTAGCCCCG GAGACCGCAT CGACGATGTC 
GGCTACCAGT GGCGCACCTA CGGGGAGAAC GTCGCCTGGA ACCAGCAGTC GCCCGCCGCG 
GTGATGAAGG CGTGGATGAA CAGCTCCGGC CACCGGGCGA ACATCCTGAA CTGCTCCTTT 
ACCGAAATCG GGATCGGCAT CGCGACCAGC AACGGACCCT ACTGGACGCA GGTCTTCGCC 
GCGCCCCGTT GA

Protein sequence

MYGWNDPRNP DGSRRQPEPA ADEPAWPTDR PEPRSAYLFG DEPDGPPHRW EPTDRREQPT 
DEWDRQQPTA HWRSDAEPAR GWGAAEHPYH GPVGDPYHEQ PTQGWEATPT WQHGEPTQNW 
QREQPGDRPD QRFAGGRNEP TGSWHGAATP TGGPEPTGQW QAPEPTGWYA DEPTTSMPSL 
AEAAAAGDVP AGEDRPRRRH RRPLLIGGAA AAATLVVSLG VGAVTFAGGG DASPTSAIDD 
IVATNPTEES AFPSGTPTSA SPSATPTTTS PSPSPSVTPS RKPSPTASRS TAAPRPTPNR 
TTAPPTNSTT APANGNVSED AAEVVRLANI ERKEAGCAAL SIDDKLMTAA QRHSQDQADN 
RKMSHDGSNG SSPGDRIDDV GYQWRTYGEN VAWNQQSPAA VMKAWMNSSG HRANILNCSF 
TEIGIGIATS NGPYWTQVFA APR