Gene Strop_0443 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_0443
Symbol
ID	5056882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	505742
End bp	506842
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	67%
IMG OID	640472716
Product	hypothetical protein
Protein accession	YP_001157306
Protein GI	145593009
COG category	[S] Function unknown
COG ID	[COG3883] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGTGCG TCCGCGCCAG CGGGAAGCAC GTCCAGCCCC AGCCCGTCAG CTCGCCGAGC 
CGGCGGTCAA CGGAAGGGAT CATTGTGACG GCACCCCCAC GCCGCTGGTT GACGCCGGTG 
GTGGCCGTGC TCACCGCGCT GGCCGTGCTC ACCGGGCCGA TACCGGCCTC GGCCACCCCC 
ACCTCCCCCC CGCTGCCCTC GGGGCACGAC GAGGAGCCGG AGCTACTCGG TGATCTCATC 
GAGGTCCGCA ACCGCGAGTA CGTCAAGGCA AAGGCCCAGC TGGCGGAGTC CGAGAAGCGC 
CAGGCCGCCC TCGAGAAGGA AATCGAGAAG GCGCAGGACG ACCTGGACGA ACTAGCCCCC 
CAGGTGGCGC AGATCGCGAC CCAGTCGTAC CGCACGGGAC GGGTCGGCGC GATATCGATG 
TTGCTGGAGG CAGACACCCC CGACTCCTTC ATCGTCCGGG CTACCGCGCT GGACGAGCTG 
AACCGCGTCA ACGACCAGCG CATCAAAGCA GTCAACACAA TCAAGATCCA CGCTGAGCAG 
TCGAAGGTGG CAGTCGACGA AGAGGTACGC AAGCAACAGA AGCTGAAAAG CGACCTCGAG 
CGCGGAAAGC TCGAGGCGGA GAAGGCCCTC CGCCTCGTCG GTGGCAACGG GCTCACCGGC 
GGCCTGGTTG ACGCCGAATC GCCGGTCGCC CGGGTCGCCC CGGGACGCAC CTCGGATGGC 
GACTGGCAGC CGCTGGGCTG CACCGAGGAT GACCCGACCA CCGGCGGCTG CATCACAGCG 
CGAACACTGC ACATGTACAA CGAGGTCAAG CGGGCCGGTT TTGACCGATT CGTCGGATGC 
TACCGCTCGG GTGGGCCGTG GGAGCACCCC AAGGGACGGG CCTGTGACTG GTCACTGCAG 
GACAGCGGGT TCCGCTCTTG GTACAACAAC GACATGCGCC TCTACGGCAA CAACCTGACC 
GCGTTCCTGG TCCGTAACGC CGACCGGCTC GGCGTCTACT ACGTGATCTG GAACCGGCAG 
ATCTGGTTCC CGGCAACCGG CTGGAAGTCG TACAACGGCC CGTCGAACCA CACCGACCAC 
GTCCACGTGT CGTTGCTGTA G

Protein sequence

MGCVRASGKH VQPQPVSSPS RRSTEGIIVT APPRRWLTPV VAVLTALAVL TGPIPASATP 
TSPPLPSGHD EEPELLGDLI EVRNREYVKA KAQLAESEKR QAALEKEIEK AQDDLDELAP 
QVAQIATQSY RTGRVGAISM LLEADTPDSF IVRATALDEL NRVNDQRIKA VNTIKIHAEQ 
SKVAVDEEVR KQQKLKSDLE RGKLEAEKAL RLVGGNGLTG GLVDAESPVA RVAPGRTSDG 
DWQPLGCTED DPTTGGCITA RTLHMYNEVK RAGFDRFVGC YRSGGPWEHP KGRACDWSLQ 
DSGFRSWYNN DMRLYGNNLT AFLVRNADRL GVYYVIWNRQ IWFPATGWKS YNGPSNHTDH 
VHVSLL