Gene Saro_1728 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1728
Symbol
ID	3916303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1820365
End bp	1821411
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	64%
IMG OID	640444469
Product	LacI family transcription regulator
Protein accession	YP_497002
Protein GI	87199745
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.531296
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGAAA TGAACATCGC AAGTACGAGC CGCGGCAACG CACACGCAAC GATGGAGGAC 
GTGGCAAAAC TCGCTGGCGT CTCGCTAAAG AGCGTGTCTC GCGTAATCAA CGCCGAGCCG 
CACGTATCGG CAAAGCTGAG GGCAAAGGTC GAGGCGGCGA TTGCCGAACT CAATTACGTT 
CCGGATACGG CAGCGCGCTC GCTTGCCGGA TCGCGGGCTT TCATCGTCGG CCTGCTGTTC 
GACAACCCCA GCCCGAACTA CACGATGAAC ATCCAGAAGG GCGTGTACGA GACCTGCCGC 
GACCAGCAGC ACCACCTGCG CATCGACAAC ATCGATTCGA CGGTTCCCGC CGAAAAGTTC 
GAGGCACAAC TGGCGGCGAT GGTGCGCAAC AGCCGATGCG ACGGGTTCGT GCTAACGCCT 
CCCCTTACCG ACAACGTGGT GCTACTCGAT TTCCTCGACC GTAGCGGCAT CCGCTATGTA 
CGCATTGCGC CGGACATTCA GCCCGACCGA TCGCCCGGGG TCTGCATCGA TGACGCGGCA 
GCAGCAGCCG CCGCCGCGCG CCACCTGTGG GAACTGGGGC ACAGGCGCTT TGCCGTGGTG 
CGCGGGCCCG CCAGCCACGG CGCGGCGGGA CGGCGACGCC AAGGCTTCAT CGACGAGTTG 
CACAGGCTCG GCGCGGAGAA CCCCATCATC GAGGCGGAAG GCAATTTCAG CTTCGAAAGC 
GGCATCGCAG CGGGTGCGAA GGTTCTGGCG GCAACCCCCC GCCCGACCGC GATCTTTGCC 
GCGAACGACG ATTCGGCCGC AGGCGTCATG GTCGCCTGCT CGCAGGCCGG ACTGAAAGTG 
CCGAACGACG TTTCAGTCTG CGGCTTCGAC GATAGCTGGG TGGCGAAGTC GGTCTGGCCC 
TATCTGACCA CCGTCTACCA GCCCATCGAG GAGATGGGCC GGGCCGCCGC GGCGCTGTTG 
CTACGCCGCG ACGAGCCCGA CAATGTCCTC CACGAACTGG ATTTCAGTCT CGTCGTCAGG 
GCTTCGACGG CACCCCCGCC CCAATAG

Protein sequence

MGEMNIASTS RGNAHATMED VAKLAGVSLK SVSRVINAEP HVSAKLRAKV EAAIAELNYV 
PDTAARSLAG SRAFIVGLLF DNPSPNYTMN IQKGVYETCR DQQHHLRIDN IDSTVPAEKF 
EAQLAAMVRN SRCDGFVLTP PLTDNVVLLD FLDRSGIRYV RIAPDIQPDR SPGVCIDDAA 
AAAAAARHLW ELGHRRFAVV RGPASHGAAG RRRQGFIDEL HRLGAENPII EAEGNFSFES 
GIAAGAKVLA ATPRPTAIFA ANDDSAAGVM VACSQAGLKV PNDVSVCGFD DSWVAKSVWP 
YLTTVYQPIE EMGRAAAALL LRRDEPDNVL HELDFSLVVR ASTAPPPQ