Gene Saro_1553 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1553
Symbol
ID	3917228
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1609227
End bp	1610573
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	63%
IMG OID	640444293
Product	putative GAF sensor protein
Protein accession	YP_496827
Protein GI	87199570
COG category	[T] Signal transduction mechanisms
COG ID	[COG1956] GAF domain-containing protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.00827304
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTGC GCCTCGCCGA CCTGGCTCCT TGCTTCGAGG GAGTGATTCC TTCGATCATC 
GCGACCGCAG CGGCCGACGG GACGCCGAAC GTTTCCTACC TGTCCCACGT CGTCCGGGTC 
GATGACGAGC ATGTCGCGCT GTCGAACCAG TTCTTCGCCA AGACCGCCGC GAACATCCGA 
GCTAATCCCC ATGTTACGCT GATCCTCGTC GATTGTTTTT CCGGGGAACA GTACCTGCTC 
GACATCCGGT TCGTGCGGTC ACTCGACACT GGGCCATTGT TCGAGAAGAT CTCGATTCAA 
CTCAAGGCAA GCAGCGCGCA GATCGGCATG TCCGAGATCA TGCGGCTAAG GAGTGCCGAC 
GTATTCAGGG TGGAAGCGAT CGAGAGGGTT CCCTGTCCGG TTGACACCGG CCCGGCACAG 
GTGCCCCGCC CGCCGGTAAG CCTTCCCGCG CTTGCGGACG GCTGCCGGGC CATCGAAAAT 
CTGGCGGAGG TGGAAGATAT CATCGACTGC CTGCTCGACC GCGTTGTCGG CCTGCTTGGC 
TATTCGCACG CGCTCGTTCT TGTCCCCGAT CCGGGCCGCG ACAGCTTCGT CACGACGGGC 
AGCACAGGCT ACGACCCCTC CGGGATCGGC TCCGAGGTCA AAGGCAGCGA GGGCATGATC 
GGTACGGCGG CCGCAAGCGG ACGCACGATC AAGGTTAGCG ACATGAGCCG CGTGCGTCGC 
TTTGCCGAAG CAATCGATGC CGACGCAGGG CTGTCCGAAA ACACGTCGCG CGTGATCGAC 
TTTCCCGGAC TTGCCGGCGT CATGAGCCAG ATCGCCGTGC CGATGGTTAC GCGGGGCGAA 
ACGATCGGCA TCCTCTTCGT CGAAAGCCCG GAGCGCATGG CGTTTCACGA CGATGACGAG 
GCAGCGCTGG AATTGCTATG CGCTGCGGCT GCGCGTGCGA TCGCGGCAGG TGAAAGCATT 
GCGTCAAGGG ACGATGATGC TTTGCCAGGC GCCGCGCGAT CGCTGCCTGT AGCGAATGGC 
GGCGCGATCC GCGTCACGCA TCACCGCCTC GACGACAGTA TCTTCGTGGA CGGCAACTAT 
ATCGTGAAGG GGATCGCGGG CGCGGTGTTG CGCCGTATCA TCGAATGGCA CCTCGTTGAC 
GGCAGGAACA CGTTCTGCAA CCGCGAACTG CGGCTCGCGC TCGCCGCGCG GATGCCCGAT 
ATCAAGGACA ATCTGGAAAC GCGCCTGTTG CTGCTTCGCC GCCGGCTCGA AGAGAAGCAA 
GCGCCGATCC AGATCGTCAG GACAGGTCGA GGAAGGCTGA GCCTTGAGGC GAAGGGGCCG 
CTGCTCCTCG CAGCGGCCCA GGATTGA

Protein sequence

MKLRLADLAP CFEGVIPSII ATAAADGTPN VSYLSHVVRV DDEHVALSNQ FFAKTAANIR 
ANPHVTLILV DCFSGEQYLL DIRFVRSLDT GPLFEKISIQ LKASSAQIGM SEIMRLRSAD 
VFRVEAIERV PCPVDTGPAQ VPRPPVSLPA LADGCRAIEN LAEVEDIIDC LLDRVVGLLG 
YSHALVLVPD PGRDSFVTTG STGYDPSGIG SEVKGSEGMI GTAAASGRTI KVSDMSRVRR 
FAEAIDADAG LSENTSRVID FPGLAGVMSQ IAVPMVTRGE TIGILFVESP ERMAFHDDDE 
AALELLCAAA ARAIAAGESI ASRDDDALPG AARSLPVANG GAIRVTHHRL DDSIFVDGNY 
IVKGIAGAVL RRIIEWHLVD GRNTFCNREL RLALAARMPD IKDNLETRLL LLRRRLEEKQ 
APIQIVRTGR GRLSLEAKGP LLLAAAQD