Gene Strop_1598 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1598
Symbol
ID	5058056
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	1818904
End bp	1819959
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	72%
IMG OID	640473871
Product	helix-turn-helix domain-containing protein
Protein accession	YP_001158442
Protein GI	145594145
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.46562
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATGTTCT CTCCTGTTCA TCACTTTCGG GACGCCGCCG TCAGCGCGGC GCTCGGCTTC 
GGTGACCTGG TGGCCGATCC GGTGTGGCTG CGTCCGATCC TGGTGGAGAG GGACCTGCTC 
ATCCTGGTCA CCGCGGGGCA TGGCCGCGCC GAGGTGGACT TCCACACCCT GTCCTGCCGC 
CCGGGCACAC TGCTGCGGGT CCGGGCCGGC CAGGTGCTTC GGTGTGGACC ATCCAGCCTT 
GGTGCGATCG TGGTGCACTG GACGTCGACG GCGCTGCACG GATTCGACGT TGCCCCCGAG 
GCGGCCCCGG CCTGGCTTGA GCTGACCGGT GCGGACGGGG CGACCATCAG CACCGGGGTC 
CATCAGCTCG CGGCGGACTG CGAGCGGCAT CGCGGGGCGC CCGCCGCACT GTTCCGCCAC 
CAGCTGGCGG CGCTGCTGCT ACGGCTGGCC CTGCTGGTGG ACTCCGGCCG GGGGTCTCAG 
CCCGCGCCGC GGTCGGCGTC GCGCACCGAG ACCAACACGT TCCGACTGCT CTGCCGGGAG 
TTGGAGCAGG GCTACCAGCG CAGCCGACGG GTGGAGGACT ACGCCGACCA ATTGGGCTGC 
TCCGTTCGTA CCCTGACCCG CGCCTGCCTG GCGGTCACCG GGCGCAGCGC GAAGCAGGTG 
GTGGACGAGC GGGTGGCGTT GCAGGCCCGC CGCCTCCTCG CGGCGACCGA CGAACCGGTG 
GCGCGAGTAG GCCAGCGGCT CGGTTTCTCC GAGCCGACCA ACTTCGGCCG GTTCTTCACC 
CGGGAGGTCG GGGTCAGTCC GGGAGCGTAC CGCGCCGCTT GGGAGCACCC CGCCGACCAC 
TCGACGCCGA CCGAACCGGA CTCGGCACCC ACCCTGCCCG CCCGGGACGC TCCGTCCCTG 
GTACGCCCGC GCCCACCCGC CGACGCCGAC GACGGTCAGT CACAGATGCC GGGCCACAGC 
GATGACCACG TCACCGCCGA GTCGGCCGTG CTCGGGGTCG CGAACAGCGG CGCCGCATCG 
CAGCAGCCCG GTGAGCGCCC GCTGCACGTC GACTGA

Protein sequence

MMFSPVHHFR DAAVSAALGF GDLVADPVWL RPILVERDLL ILVTAGHGRA EVDFHTLSCR 
PGTLLRVRAG QVLRCGPSSL GAIVVHWTST ALHGFDVAPE AAPAWLELTG ADGATISTGV 
HQLAADCERH RGAPAALFRH QLAALLLRLA LLVDSGRGSQ PAPRSASRTE TNTFRLLCRE 
LEQGYQRSRR VEDYADQLGC SVRTLTRACL AVTGRSAKQV VDERVALQAR RLLAATDEPV 
ARVGQRLGFS EPTNFGRFFT REVGVSPGAY RAAWEHPADH STPTEPDSAP TLPARDAPSL 
VRPRPPADAD DGQSQMPGHS DDHVTAESAV LGVANSGAAS QQPGERPLHV D