Gene Strop_3031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3031
Symbol
ID	5059495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	3462296
End bp	3463726
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	72%
IMG OID	640475281
Product	membrane-flanked domain-containing protein
Protein accession	YP_001159846
Protein GI	145595549
COG category	[S] Function unknown
COG ID	[COG3428] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.687058
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGAGC CGGCCGCGCG AGACCCGGAG GAGACCCGGC CACCCGCCCC ACAGCCGTAC 
CCCGGTTGGT ATCCACCCAC CCCGCCACCG CCCACCCCTC CGGTGCCCCC GCACGGAGGC 
GAGCGCCGGC AACGGCTCCA TCCGCTCTCC CCTGCGCTGC ACGGTGCCAA GTCGCTGGTC 
GTGGTAATCG CCGGGCTCTC CTGGTCAACG TTGTCCCGGG TCGGCTTCGG CTGGTTCGCG 
GTGATGGCGG TGGTGCTGGC GATCGGTGCC ACCGTGCTCG CGGTGGTGAG CTGGTACAAC 
ACCGGCTATC ACGTCGTGGA CCGCGAGCTG CGGGTACACG AGGGCCTGCT CTGGCGACGC 
ATCCGGGCGA TCCCGCTGGA GCGGCTCCAG GCCGTGGAGG TGGTTCGGCC GTTACTCGCC 
CAGCTCACCG GATTGGCGGA GCTGCGCCTC GAGGTGGTCG GCGGCGGCAA GACCGAGGCA 
CCGCTGGCCT ATCTCAGCGT GGCCGACGCT GCCGCCCTGC GACAGCGGCT GCTCGCGTTG 
GCCGGTCCGC AACCGGAGGG CGCCGCCCTG ACACCGGGCA CACCGCAGGT CTGGCCGGAA 
GCGACTCCCC CTGGCGAACC GCTGCACGTC GTCCGGAACA CAGACCTGTT ACTGAGCCAG 
CTACTCACCC CGCAGACCTT CATGATCCCG TTCGGGGTGG TCTTCGTGGC GACGCAGTTC 
CTCTCCGGGG ATTCCTGGTC GTTCGTCGCG GTGGCGAGCA CGTTGACCGC GATGGCCGGG 
GTGCTGCTAC AGCCGATCCG CCGAGTGCTG GACAACTGGA GCTTCCGGCT GGCTCGTGAT 
GTCGACACCC TGCGGATCCG CAACGGCCTG CTGGAGACCC GGGCGCAGAC CGTCCCGCTG 
CACCGGGTAC AGACGGTCGG TGCGACCTGG CCGCTGCTGT GGCGGGCGAA GGGCTGGCTG 
CGGCTACGGC TGGAGGTGGC CGGCTACTCG ACGGGGGAAG CTGACGGGCG CAACCGACCA 
GACCAGCTCC TCCCGGTCGG TCAGCAACCG GTCGCCGAGG CGATCCTCGC CGAGGTGCTG 
CCCGGGGTAC GCCTCGACGA CCTGCCGCTT ACCGCACCGC CGACCCGGGC TCGCTGGCTG 
AACCCCCTGA GTCAGCCAGT GCTCGGTGCC GGGCTGCACG AGCGAGTGTT CGCGGTCCGC 
TCCGGCCTGC TCACCCGCCA GATCGTGGTC GTGCCGTACG CGAGGATCCA GAGCGTGCGG 
GTGGTGCAGG GGCCGGTGCA GCGACGGTTG GGACTGGCGA CGGTGCACGC GGACACCGCC 
GGCGGCGCCG GGGCCGCCGC CGACGACCGA GCGGTCGCCG AGGCGTGGGC CCTGGCCGCC 
GAGCTGACAG CGCGTGCGCA CCAGGCGCGC CGCGCCAGCC GACCGCAGTA G

Protein sequence

MSEPAARDPE ETRPPAPQPY PGWYPPTPPP PTPPVPPHGG ERRQRLHPLS PALHGAKSLV 
VVIAGLSWST LSRVGFGWFA VMAVVLAIGA TVLAVVSWYN TGYHVVDREL RVHEGLLWRR 
IRAIPLERLQ AVEVVRPLLA QLTGLAELRL EVVGGGKTEA PLAYLSVADA AALRQRLLAL 
AGPQPEGAAL TPGTPQVWPE ATPPGEPLHV VRNTDLLLSQ LLTPQTFMIP FGVVFVATQF 
LSGDSWSFVA VASTLTAMAG VLLQPIRRVL DNWSFRLARD VDTLRIRNGL LETRAQTVPL 
HRVQTVGATW PLLWRAKGWL RLRLEVAGYS TGEADGRNRP DQLLPVGQQP VAEAILAEVL 
PGVRLDDLPL TAPPTRARWL NPLSQPVLGA GLHERVFAVR SGLLTRQIVV VPYARIQSVR 
VVQGPVQRRL GLATVHADTA GGAGAAADDR AVAEAWALAA ELTARAHQAR RASRPQ