Gene Saro_3048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3048
Symbol
ID	3916660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3263390
End bp	3265195
Gene Length	1806 bp
Protein Length	601 aa
Translation table	11
GC content	68%
IMG OID	640445828
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_498317
Protein GI	87201060
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.229221
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAAAAA TGCGGCACTT GCATGCCGGA AGATCATACC CGGAGCGGAG GCAGCCGATG 
CTGCAAGGGC AGTCGATCAC CAGGAAAGTC ATGGCCGGAT GCCTGATCCT TGGCCTCGGC 
GCCATGGCGT CCACGGGCCT CGGCCTGGCC GGGACCGTGC GGCTGGAGGC GGCTATGGAG 
AAGCTCAATG CCGCGACCGC CCTGCTGCGT GCGCACATGG AGGCCGACAT GGGGCACGAC 
GCAATCCGGA GCGAAGTGGT TAGCATCGTC GCATCCAGGC AGACGGCGGC CATCGACGGG 
CTTGCGGCGG GTCGCGAACT GGCCGACAGG CTGGTCGAGT TCGAGAAGAA CATGGAACCG 
ACCGCCAAGG TCGAGGATGC GCCGGAAGTG AGCGCCGCGC GCGCGGCAGC CGACCCTGCG 
TTCAGGGCCT ATGTGGCGAT CGGCCGCGAA GTTTCGGCTG CCGCAGAACG CGGCGCTGTG 
CCGGGCGATG CCGAACTGCA GAGGTTCCAG CATCTGTTCA CGCAACTTGA AGCGGATATG 
TCGAAGATCT CCGACGCGGT CGAGGCGCAT TCGAGCGAGA CGGTCGCAGA GGCAAGCTCT 
GCCGCCGCTC AGGCGCGCGT GCTTGGCATC GGCAGCCTGT TCGTACTGCT TGGCATTCTC 
GCCGCGGTGG TCCGGTTTGC CCGCCGCGAT CTCGTCGACC CGGTCATCGC CATTGCCGGA 
AGGGTCCGGG CCATGTCCGA CGGGCGGCTC GACGTGGAAA TGGACGGGGC CCGACGGGCC 
GACGAGATTG GCGACCTTGC GCGCTCGGTC GTGGCCCTGC GCGACAACCT CGCCCAGGCG 
CGGGCCGAGA CCGCCGGGCA GGCGGAAGCG ATCGTGGCTT CGATCGGGGC TGGGCTGAGC 
CAGCTTGCTT CCGGCAACGT CGGATATCGA ATTCGCGAGA CGCTCGCCGG TCCGTTCCAG 
AAGCTGCGCG ACGATTTCAA CCGCGCCATG GACGAGATGG CTTCCGCCCT GTGCGCGGTG 
CAGACGGCTA CCGCGACGCT CGATGCGGTC GCGCGCGATA TCGGCGGTGC GGCGGGGGAC 
CTGTCCAACC GCAACGCCAA CCAGGCCGCC AGCCTGCAGG AAACCGCGGC CGCCATCGCC 
AGCCTTGCCC AGCGCGTCGC TGGATCGTCC GAGGCCGTCA CGGCCGCACG GGCAGCCGTC 
GGCCACGTCG GCAGCGAGGT CAGCCGGGGC GGCGGCGTCA TCGACGACGC GGAGCAGGCA 
ATGGATCGGA TAGAGATCGC CTCACAGGAA ATCGGCACGA TCGTGGGCGT CATCGACGGC 
ATCGCCTTCC AGACCAACCT GCTCGCCCTG AACGCCGGGG TGGAGGCCGC GCGCGCGGGT 
GAATCGGGCA AGGGCTTTGC CGTTGTCGCC AGCGAGGTTC GCGCGCTTGC CCAGCGCAGC 
GCCGACGCGG CGCGGGAGAT CAAGCAACTT ATCGCCAACT CCTCGTCCGA GATCGGTGAC 
GGTGTTCGGC TGGTGCGCGA TGCCGGCAGC AGCTTGCGCG CGATCAGCGC GCAGATGGAC 
GAGATCAACC GCGTGATGGA GGTCGTGGAG GCGGGCGCCA GCGACCAGGA CGTTTCGCTG 
CGCTCCATCG ACGAGACGTC GCGCCAGATG GAACAGATAA CCCAGAGCAA CAGCGCGGTC 
GCGGAACAGG TCGGCAATGC GAGCCATGCC GTCGTCTCTG CGATCGAGGA CGTGCTGCGG 
CAGTTGCAGC GTTTCGAGAT CGGTGAGGCC CGGCGCCCTG CACAAATCCA GGCGCTTGCC 
GCATGA

Protein sequence

MRKMRHLHAG RSYPERRQPM LQGQSITRKV MAGCLILGLG AMASTGLGLA GTVRLEAAME 
KLNAATALLR AHMEADMGHD AIRSEVVSIV ASRQTAAIDG LAAGRELADR LVEFEKNMEP 
TAKVEDAPEV SAARAAADPA FRAYVAIGRE VSAAAERGAV PGDAELQRFQ HLFTQLEADM 
SKISDAVEAH SSETVAEASS AAAQARVLGI GSLFVLLGIL AAVVRFARRD LVDPVIAIAG 
RVRAMSDGRL DVEMDGARRA DEIGDLARSV VALRDNLAQA RAETAGQAEA IVASIGAGLS 
QLASGNVGYR IRETLAGPFQ KLRDDFNRAM DEMASALCAV QTATATLDAV ARDIGGAAGD 
LSNRNANQAA SLQETAAAIA SLAQRVAGSS EAVTAARAAV GHVGSEVSRG GGVIDDAEQA 
MDRIEIASQE IGTIVGVIDG IAFQTNLLAL NAGVEAARAG ESGKGFAVVA SEVRALAQRS 
ADAAREIKQL IANSSSEIGD GVRLVRDAGS SLRAISAQMD EINRVMEVVE AGASDQDVSL 
RSIDETSRQM EQITQSNSAV AEQVGNASHA VVSAIEDVLR QLQRFEIGEA RRPAQIQALA 
A