Gene Saro_3839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3839
Symbol
ID	5077450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009426
Strand	-
Start bp	6095
End bp	7735
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	62%
IMG OID	640480949
Product	sigma-54 dependent trancsriptional regulator
Protein accession	YP_001165611
Protein GI	146275450
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3829] Transcriptional regulator containing PAS, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.719613
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGACAC TTCCAGGCTA CGCCGACATT GCCAGCAAGC TGCAGTTCTC ACCGGAAATG 
GGCCGGATCT GGCACGATGG TGAACGCTGC GTACTGCTCA GCCAAGCGGC TCTGGCCAGC 
TGGCGCAGCC GCCTAGTTGC CGAATTGGGG CACGAAGCGG CCAGCCGGTT CTTCTGGGGT 
GTCGGTTTTG CCGAAGGCGC ACGGTGCGCG ATCGGCGCGA AAAAATTACG CCCGGATGGT 
GATTATCTTG AAGCATTCGC GGTCGGACCG CAGGCGCACG CCTTGACCGG GTTTGGCTGG 
ACCCAGATCG AAATCCTGGA AAATGATTCC TCGCGAGGGC ATTTCGAAGG CCGGTTCAGG 
GTCCACGATT CGATCGAGGC GGCGATCCAT CTCAGCGCGA CCGGGTACAG CACTGACCCG 
GTGTGCTGGA TGCAGACTGG CTTTGCCAGC GGCTTTGCCA CAACCTTCGC GGGACAACCG 
ATCATCATGC GCGAAGTGGA ATGTGCGGGG CGAGGCGATG CCGCCTGCGT ACTTCACGCC 
AAACCAAAAC CCGAATGGGA TCAGTTGGAC AACCTCGAAT TGGCCGCGAC GCCGCTGGTC 
CTGCCCGAAA CGCGGCATGA TGGGGGCCAA ACGGTGATTG GGATCTCGGC AGGGTTCCTC 
TCAGCCAAGA CCATGATCGA ACGCACCGCG TCGAGCAATG CGACGCTGCT GTTAATGGGC 
GAGACCGGGG TCGGCAAGGA AGTGCTGGCC AAGCTCGCTC ATCGGCTGAG CATGCGCGAG 
GCGGAGCCGT TCATCGCGCT CAACTGCGCG GCGATCCCCG AGGGGTTGAT CGAATCGGAG 
CTGTTCGGCG TGGCCAAGGG GGCCTATACT GGCGCGGTTG CCGCCCGGCC CGGTCGGTTC 
GAGCTGGCCA ATGGCGGCAC GCTGTTCCTG GACGAGATTT CGACACTGTC GCCACTTGCA 
CAATCGAAGA TTCTGCGCGC TGTCCAGGAA GGTGAGTTCG AGCGGGTCGG CGATACGCGG 
ACGATCAAGG TGGATGTCCG ATTGATCGCA GCATCCAATG TGGAACTTAA CGAGGCGGTG 
CGGGAAGGCA CGTTTCGTGC CGACTTGTTC TACCGGATAT CGACTTTGCC GGTCCGGGTG 
CCGCCGCTGC GCCAGCGCCG CGAGGACATT CCGGTGCTGC TGGAACACTT CCGTCTGCAT 
TATGCCATGC GCCATGGCCG AACGGTATCG GGCTTCACCC CGCGGGCGAT CAACGCGCTG 
CTGGTGTACG ATTTCCCCGG TAATGTGCGC GAACTCGAGC GAATGGTGGA ACGTGCCGTG 
CTGCTGGCGG ACGACGGGCG AGCGATCGAC GTCAGGCACC TGTTCCTCGA AACCGACGGT 
CTCGAATTGA AGCCGACGAT GGGCATGACC AACGATGGCA GGATCAGCGC CGTTGACAAT 
GTCGGCGATC GCGCCGGCTT GGTGCGCCAG ATGCTGGATC TGATCGTCGA TGGGGGCGGA 
AGCCTGCTGG AGATGGAAGG GCTGGTGATC CGCGAGGCCC TTGATGCGAG TGGGGGCAAC 
GTTGCGCGCG CGGCGCGCAC CTTAGGCTTT ACCCGTCGGC AGCTCGCCTT GCGTCTTGAA 
AAGTTGGAAA TCCAGGAATA A

Protein sequence

MKTLPGYADI ASKLQFSPEM GRIWHDGERC VLLSQAALAS WRSRLVAELG HEAASRFFWG 
VGFAEGARCA IGAKKLRPDG DYLEAFAVGP QAHALTGFGW TQIEILENDS SRGHFEGRFR 
VHDSIEAAIH LSATGYSTDP VCWMQTGFAS GFATTFAGQP IIMREVECAG RGDAACVLHA 
KPKPEWDQLD NLELAATPLV LPETRHDGGQ TVIGISAGFL SAKTMIERTA SSNATLLLMG 
ETGVGKEVLA KLAHRLSMRE AEPFIALNCA AIPEGLIESE LFGVAKGAYT GAVAARPGRF 
ELANGGTLFL DEISTLSPLA QSKILRAVQE GEFERVGDTR TIKVDVRLIA ASNVELNEAV 
REGTFRADLF YRISTLPVRV PPLRQRREDI PVLLEHFRLH YAMRHGRTVS GFTPRAINAL 
LVYDFPGNVR ELERMVERAV LLADDGRAID VRHLFLETDG LELKPTMGMT NDGRISAVDN 
VGDRAGLVRQ MLDLIVDGGG SLLEMEGLVI REALDASGGN VARAARTLGF TRRQLALRLE 
KLEIQE