Gene Strop_2999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2999
Symbol
ID	5059463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	3429571
End bp	3430581
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	72%
IMG OID	640475250
Product	regulatory protein, MerR
Protein accession	YP_001159815
Protein GI	145595518
COG category	[C] Energy production and conversion [K] Transcription
COG ID	[COG0789] Predicted transcriptional regulators [COG1413] FOG: HEAT repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.645753
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGATCG GCGACGTGGC GCGCCGCTCG GGAGTGAGCA CCCGCATGCT TCGGCACTAC 
GACGCACTGG GGCTGGTCCG ACCGACGGGT CGTACCTCGG GCGGCTACCG CGAATACTCG 
GACGAGGACG TACGGCGGCT GTTCCAGGTG GAGAGCCTGC GGTCACTGGG GCTGTCGCTG 
CGCCAGATCA CCCGGGCGCT CCAGGATCCC ACCTTCACAC CGGCCGGCCT GGTCGGCGAC 
CTCATCACCG TGACCGAAGA GCGGCTGGAG CGGGAACGGG AGCTGCTCGA CCGGCTTCGT 
ACGGTCGATG CCGCGGCGCC CTCCGGATGG TCGGGGGTCC TGCGCATCAT CGAGCTCATA 
ACCGGGCTCA ACTCACCCAG TGCCGCCCTG CGTCAGCAGA GTGTTCTGGC CCCCGCCGAG 
GAGGCACGGG TGCCCGCCGA GTTGCTGGCC GGCGCGGTCC TCGCCGAATC CGACCCCAAC 
GTGGCCGGCG CGCTGCGATG GGCGCTCGCT CGGGCGGGCG GTGACCCCCT GGCGAGCCTG 
GCCTCCGGTG TCCACTCCGA GAACGTGGAC ATCCGCCGCC GCGCGATCCA GGCGGTCGCC 
GCCCTGACCG GTGACGAGGC GACAGCAGCG CTCGTGAACG CCCTCGGCGA CCCGGACCCG 
GCGGTCCGCC GACACGCGGC CCTGGCGCTG GGCCGGCGTG GCGAGGTGGC GGCCGTGCCC 
GCACTTGTCG ACCTGGTGGT CGAGGGCGGG CACGACGTCC AGGCGGCCGA ACTCCTGGGG 
GCCCTGTCGG AGGACCCGGC CCGCGCGGAA CAGATCGTCA GCGCCCTCTC CGACGAGCTC 
GCCGCCCCTA CCGCGGACTC CGCCGTCCGG AGCCGGCTCA CCCAGGCCAT CCTGGAGCTG 
CCCCGGACCG TCGCGCAGCC CGTCCTGCGA CGGTTGTCCC ACGACGATGA CCCGGTGGTG 
GCACTGACCG CCGCGGCCTA TCTGGAAGAC GAAGACTCCA CGTCTCGTTA A

Protein sequence

MLIGDVARRS GVSTRMLRHY DALGLVRPTG RTSGGYREYS DEDVRRLFQV ESLRSLGLSL 
RQITRALQDP TFTPAGLVGD LITVTEERLE RERELLDRLR TVDAAAPSGW SGVLRIIELI 
TGLNSPSAAL RQQSVLAPAE EARVPAELLA GAVLAESDPN VAGALRWALA RAGGDPLASL 
ASGVHSENVD IRRRAIQAVA ALTGDEATAA LVNALGDPDP AVRRHAALAL GRRGEVAAVP 
ALVDLVVEGG HDVQAAELLG ALSEDPARAE QIVSALSDEL AAPTADSAVR SRLTQAILEL 
PRTVAQPVLR RLSHDDDPVV ALTAAAYLED EDSTSR