Gene Sare_3489 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3489
Symbol
ID	5704760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4024455
End bp	4025471
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	65%
IMG OID	641272916
Product	LacI family transcription regulator
Protein accession	YP_001538282
Protein GI	159039029
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.148473
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0487492
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCATC ACCCGGCCAA GCCCCCCCAG CCCCGACGGC CCACGATGGT GGATGTTGCG 
CGGCATGCCG GTGTCAGCCT CAAGACCGTC TCCCGCGTGG TCAACAACGA GCCGGCAGTG 
GGCCCTGAAC TTGCCGGGCG AGTCATGACC GCCATCTCGG AGTTGGGGTT CCGGCGCAAC 
GGCATTGCCC GCAACCTTCG ATCCCAGCAG GTCAGTTCGA CGATCGGCCT GCTCATCGAG 
GAGATCGCCA ACCCCTTCTA CGCGGAGATC GCGGGTGTCG CGGCGGAGAT CGCGGCAGCA 
CACCAGACAC TACTGATCAC CGCATCCTCG GAAGAGGATC CGGAGCGCGA ACGCACGCTG 
TTGCTGGAGA TGGCGCAGCG CCGGGTGGAC GGCCTGCTCG TGGTTCCGGC CGGCGTGGAC 
CATTCCTTCC TTCGACGGGA GGTGGAGATG GGTCTGCCGG CGGTGTTTCT CGACCGGCCG 
CCGGGGCAGC TACTTGCCGA CGTGGTCCTC CTGGACAACC AGGGCGGAAG TCGCGCCGGA 
ATCCGCTCAC TGCTCGACAC GGGGCACCGG CGGATCGGAA TTTTGTTGGG TTCGTTGAGC 
GTGTACACAA TGCGTGAGCG ATTGGCCGGT GTACAGGCCG AGTTGTCAGG TGCCGGAATC 
CCGTACGACG AGGCTTTGGT GCGGAGCGGA ATAGAGGGTC CCGAACAGGC CAGCCAGGCG 
GTGGCAGACA TGTTCGATCT GGCCGACCAG CCCACGGCTT TCTTTTGCGC CAACAATCGC 
CTCACGCTCG GCGCGCTCCA GGAACTCCAC CGCCGAGGAA ACGATGCGGC GTTGGTCGGT 
TTTGACGACT TCGAACTGTC CCATCTGATG CCCAGACCGT TCACCGTCAT CGCCTACGAC 
CAGCGTGAAC TGGCACGGGT CGCGACGGAG CAGCTGTTCG GGCGCATCGG CGGAAATCGG 
TCGTGGCCGT CGACCACGGT CCTGCCGACG CATCTGGTGC AGCGCGGCCT GGACTGA

Protein sequence

MLHHPAKPPQ PRRPTMVDVA RHAGVSLKTV SRVVNNEPAV GPELAGRVMT AISELGFRRN 
GIARNLRSQQ VSSTIGLLIE EIANPFYAEI AGVAAEIAAA HQTLLITASS EEDPERERTL 
LLEMAQRRVD GLLVVPAGVD HSFLRREVEM GLPAVFLDRP PGQLLADVVL LDNQGGSRAG 
IRSLLDTGHR RIGILLGSLS VYTMRERLAG VQAELSGAGI PYDEALVRSG IEGPEQASQA 
VADMFDLADQ PTAFFCANNR LTLGALQELH RRGNDAALVG FDDFELSHLM PRPFTVIAYD 
QRELARVATE QLFGRIGGNR SWPSTTVLPT HLVQRGLD