Gene Saro_2168 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2168
Symbol
ID	3918833
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2305885
End bp	2307321
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	63%
IMG OID	640444923
Product	hypothetical protein
Protein accession	YP_497441
Protein GI	87200184
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.355326
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAG CCATCGCTGC GCTTCTGGCA GCCGCCCTCC CCTTCGCCCT CCCGCTGTCT 
GGCGCATCGG CCGACGTCGG CAGTTCGATG GACTCGTTTC TGAACGACGT CGGGGGCGCT 
GCCAACGTCA ACGGACCGAC CGCGTTCCAG GGGCAGTCGG CCGGCTATTA CAGCCTCGGC 
AATGTCTGGA CGCGGTTCCC GCAGAAGACG ACCAACATCG CCAATCTGCA GTTGCCGCGC 
GCTCGCGCCG GTTGCGGCGG CATCGACATC TTTGCGGGGT CCTTCAGCTT CATCAACGCG 
AGCGAGATCG TCGCGATGCT GAAGGCAGTC GCGAACAATG CTGTCGGCTT TGCCTTCAGC 
CTAGCGATCG ACACGGTCTG CCCGGAATGC TCGAAGATCA TGCAGGAGTT CAGCCAGAAG 
GCTCAGCTCA TGAACAACCT CAACATCAAC TCCTGCGAGA TGGCCCAGGG TCTGGTGGGC 
GGGATCTGGC CCAAGGGCGA CCTTGCCGAC AAGGCGATCT GCGAAGCGAT CGGCAACTCC 
GAAGGGATTT TCACCGACTA TGCCGCGGCC AAGCATGGGT GCGGCACCAA GGGGCAGCGA 
TCGAGCACGA CCGCGCAAGG CTCAGGCAAA TATGATGACG TCAATCCCGG GGTGCCGCGC 
AACTACACCT GGACGATCCT CAAGAAGTCG GCGTTCTTCT CGCCAGGCGG CCGGTTCGAC 
GAAGAGCTCG CCGAATATGC GATGACGCTG CTCGGCACGA TAATATACGT GCCCCCAAAG 
GACGATGAGC TGGGCAAGTT CGTGCCAATC GTCGGCGAAG CCTCGTCCAC CCTCGTGACT 
TCGCTGCTGG ATGGCACGGC GAATGGCAAT GTCCTCATTT TCGACTGCGA CGAGCCGGAA 
AAGTGCCTCA ACCCGGGCTT CAAGTCGCTG AGCCTGCCGG CATCGAAAGC GCTGCGGCCG 
CGCGTGGCTG CGCTCATCGG CGGTATGGTT CAGGCCATCC GCGACGACAC CGCGATCAGC 
GAAGAGCAAA AGGAACTGCT GCAAGTCGCG TCTATCCCGC TCTACAAGAT CCTGACCGTC 
CAGGCGGCCT ATGGCCGGGG CATGCCGACC GACGACCGGG AGACCCTGGC CGAGATCGCC 
AGTGTCGACC TGCTGTTTGC TGTGCTCGAC CGGATAGTGA GCGAGGCGGG CCGCTCGATG 
TCGAGCTTCA TCGGGGCCGA CGAAGCCAAG ATCGCCATGT GGCAGAATCA GGTCAATGTC 
GTGCGTCAGG CGCTCGCTGA CCGGCAGGCC AACACGCATC TCAAGGTCAA TGCGGTGCTG 
CAGATCATCG AGAAGACGGC GTTCATCGAG AACGTGCTGG CCGCCTCGAT GTCGCCCGGA 
ATGGCCGCAT CGCTGGACTG GTCGCGCGGC GTCCAGAGCC GCGCCCTTAC CCACTGA

Protein sequence

MKRAIAALLA AALPFALPLS GASADVGSSM DSFLNDVGGA ANVNGPTAFQ GQSAGYYSLG 
NVWTRFPQKT TNIANLQLPR ARAGCGGIDI FAGSFSFINA SEIVAMLKAV ANNAVGFAFS 
LAIDTVCPEC SKIMQEFSQK AQLMNNLNIN SCEMAQGLVG GIWPKGDLAD KAICEAIGNS 
EGIFTDYAAA KHGCGTKGQR SSTTAQGSGK YDDVNPGVPR NYTWTILKKS AFFSPGGRFD 
EELAEYAMTL LGTIIYVPPK DDELGKFVPI VGEASSTLVT SLLDGTANGN VLIFDCDEPE 
KCLNPGFKSL SLPASKALRP RVAALIGGMV QAIRDDTAIS EEQKELLQVA SIPLYKILTV 
QAAYGRGMPT DDRETLAEIA SVDLLFAVLD RIVSEAGRSM SSFIGADEAK IAMWQNQVNV 
VRQALADRQA NTHLKVNAVL QIIEKTAFIE NVLAASMSPG MAASLDWSRG VQSRALTH