Gene Saro_1320 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1320
Symbol
ID	3917769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1363722
End bp	1364750
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	68%
IMG OID	640444057
Product	LacI family transcription regulator
Protein accession	YP_496598
Protein GI	87199341
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.593334
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGAGCG ACAGGAAGAT CATCCGCGTA ACGTCGTTCG ACGTGGCCGA AGCGGCGGGC 
GTCAGCCAGT CCACCGTCAG CCGCGCACTG GCAGGCGACA CGTCGATCAG CGAGCCGACG 
CGCCAGCGCG TGATCGAAGC GGCACGCCGC CTGAACTACC AGGTGGACGA GAACGCGGCA 
CGCCTGCGCC GGGGCCGCAC CGGCACACTC GCGGTCGTGA TGATCTGCCG CGAGGCGCAG 
GACCGCAAGG ATATCAACCC GTTCTACTTC TCGCTCCTGG GCAGCACCTG CGCGGCTGCA 
TCGGCGCGCG GATACGAAAC GCTGGTCTCG TTCCAGGATG CTCCCGAAAA CTTCTGGGGC 
CACTTCCAGG AGCGGCGCAA GGCCGATGGC ATGATCGTGA TCGGCACGAC GACCAACACG 
GCGGCGTGGG ACTATTTCCG CGACATGCCG GAAGGCACGC ACTGGACCTG CTGGGGCTCA 
CCCGACAACG ACATGCCCTG GGTGCGCAGT GACAACCTTT CGGGCGCCAC GCTGGCGACG 
CGCCACCTGC TGGTGCGCGG CTATCGCCAG ATCGTGTGCA TCGGCTCGGC CACCTCGCCC 
CAGCGCCAGT TCCAGGAACG GTATGAAGGC TACGCCGAGG CCATGCGCTC GGCCGGGCTC 
GAACCGCGCC TGCAACAGGT CGAGAGCGGC CTCGCACGCG AGGAACAGGG CCGCCGCGCG 
GCGATAGCGC TGGCGGAAAG CGGAGAGCAG TTCGACGCCA TCTTCGCGGT CTGCGACGAG 
ATGGCGCTGG GCGCGCTCAA GGAACTGACC GCGCGTGGCT ATGCCGTGCC GGACCAGGTC 
GGGATCATCG GCTTCGACGG CATCCGCGCC GGCGCATGGT CGACCCCACC CCTCACCTCG 
ATCGAACCCG ATTTCCAGAT GGCCGGCGGA TTGCTGGTCG AACAGCTGCT GGCAAAGATC 
AACGGGACCG AAGGCTCGGG CCGGCGCGTG CCGGTAAGGC TGGTTATCCG GGGCTCAACA 
CGGCCCTGA

Protein sequence

MPSDRKIIRV TSFDVAEAAG VSQSTVSRAL AGDTSISEPT RQRVIEAARR LNYQVDENAA 
RLRRGRTGTL AVVMICREAQ DRKDINPFYF SLLGSTCAAA SARGYETLVS FQDAPENFWG 
HFQERRKADG MIVIGTTTNT AAWDYFRDMP EGTHWTCWGS PDNDMPWVRS DNLSGATLAT 
RHLLVRGYRQ IVCIGSATSP QRQFQERYEG YAEAMRSAGL EPRLQQVESG LAREEQGRRA 
AIALAESGEQ FDAIFAVCDE MALGALKELT ARGYAVPDQV GIIGFDGIRA GAWSTPPLTS 
IEPDFQMAGG LLVEQLLAKI NGTEGSGRRV PVRLVIRGST RP