Gene Saro_2508 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2508
Symbol
ID	3916829
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2710971
End bp	2712032
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	67%
IMG OID	640445265
Product	AraC family transcriptional regulator
Protein accession	YP_497778
Protein GI	87200521
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAGCG CCGACAACAT TCTCGCTCAT GCCAGCGCCA TGCGGCAGTT TTCCCAGTTC 
GCGGGAGTGG CCGGGCTCGA CCTGCGCCGC GCCTGCCCGC CAGACGTCTA CGCATTCGTC 
GAGCAGGCGC AGGATGCGGA GTGGTTGCCG GCGACGGCCC ACGTCGATGT TCTCCAGGCC 
GCCGCAATCG CTTCGGGCCG GGCAGACCTC GGTGTCGCAT TCGCCATGTG GTGCAACATC 
CGTGGCTTCG GTCCTGTGAG CCTGCTGTGG GACCATTGCA CCACTGTCGA CGAGGCGAGC 
CGCATTACCC GGCGCTACAT GCACCTGGAG AGCGCGGCCA TGCGATCGAG CACGGATACC 
GACGGGCACG AGGCTGCGCT GCGCCACATC CTGATGGTTC CGGCCCGTTT CGGCGGATCG 
CAGTTCCTGC AGGCTACGCT GGCGCTGCAA CTGCGCATCA TCCGGATGCT TCTGGGCGAG 
GAGTGGACGC CGATCAGGCT CGAGCTGGAT CATCCCGCGC CGCCTTCGTA TCGCTATCAC 
CAGGCCGTGT TCAGATGTCC GATCGAGTTC GAGGCGGACC GGTGCGCACT GGTTTTCCGC 
AAGTCGGACC TGCACCGGCC TTCGCTGCGC GGGAATGCGA ACATGGTGCA ATATCTCGAA 
CGGCAACTGG CCCATGCGGA TTCGCACTGG CCCGGCGATC TCGTCCAGCA GATCCGCTAT 
TTCGTCGCCG CCAACCTGAC CGAGCGCAAG GCCAACCTCG CGCATGTCTC GGGGCTCGCC 
GGGCTCTCGT CGCAGAGCCT GCAACGCCGC CTGGCCGAAC GGGGAACGAC GTTCGCGACG 
ATCCTCGAGG AGGTGCGCAA GCAGACGGCG GACGAGTATT TCCGTACCGC GCGCCGCCCG 
AACCTGACGG AGCTTTCGCA TCGACTGGGC TATACCGACG CGAGCGCGGC AAGCCGTTTC 
CTGCGCCAGC ACATGTCGAC CGGCGCCCGC GCGTTGATGG CGCAGGTAAG GCCGGGGCGC 
GGTCGTCCGG GCAGTGCCCG CGCGCTAGCG GCCGAGGCTT GA

Protein sequence

MTSADNILAH ASAMRQFSQF AGVAGLDLRR ACPPDVYAFV EQAQDAEWLP ATAHVDVLQA 
AAIASGRADL GVAFAMWCNI RGFGPVSLLW DHCTTVDEAS RITRRYMHLE SAAMRSSTDT 
DGHEAALRHI LMVPARFGGS QFLQATLALQ LRIIRMLLGE EWTPIRLELD HPAPPSYRYH 
QAVFRCPIEF EADRCALVFR KSDLHRPSLR GNANMVQYLE RQLAHADSHW PGDLVQQIRY 
FVAANLTERK ANLAHVSGLA GLSSQSLQRR LAERGTTFAT ILEEVRKQTA DEYFRTARRP 
NLTELSHRLG YTDASAASRF LRQHMSTGAR ALMAQVRPGR GRPGSARALA AEA