Gene Saro_1919 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1919
Symbol
ID	3917142
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2032081
End bp	2033382
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	65%
IMG OID	640444665
Product	hypothetical protein
Protein accession	YP_497193
Protein GI	87199936
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0683862
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTGTTA CTTTCGGTCG CATGACTGGC GGCCTGATCG GCAAGACGGC AATGGCCCTC 
GTCCTTGCAG CTGGCGGCCT GGCCGTCGGC GCAACCGGCG CGGTTGCCAA GGAAAAGGAA 
CAGAAGGTCG CCAAGGCGAC GAATTCGCCT GAATTCGGCA AGGCCGCGCA GACGCTGCAA 
AAGCCCATCG CCGACGTAAC CGCCAGCAAG GACAAGGCTG CGGCGCAGGC GCTGATCCCC 
CAGCTTGCGG CCATCGAAGC GTCGGTCAAG ACCCCACTGG ACCGCATCAT CTACGGTCAG 
TGGCAGCAGC AGATCGGCGC CGCCGCAGGT GACAGTACGC TGCAGCAGAA GGGCCTCCAG 
AACATGGTGG ATAGCGGCCA GCTTGGCGAC AAGGCTACGC TGGTTGCCTA CTACCTTGGC 
ATGACCGCCT ATCAGAACAA GGACTATGCA ACCGCGTCGA AGGTGCTCGG CCCCCTCGTT 
GCGGCCAACT ACAACGACGA TACCGCGGCT GAAGTCCTTG CCGACTCGTT CGCCCAGCAG 
GGTCAGGCCC CGCAGGCTCT CGAGGCGCTG AAGGGCGCCG TGGCGGCCCG CAAGGCTGCA 
AACGGCACCG TGCCCGAAGG CTGGTTCAAG CGCGCCAACC TCATCGCCTA CAAGAACAAG 
CTGGCGCCCC AGGCTATCGA ATGGTCGACC ATGATGGTCG AGAACGACCC GACCCCGCTG 
AACTGGCTTG GCGCTGGCCA GTTGGTTCGC GAGTTCGGCC AGTTCACCAG CCAGGAATCG 
CTTGACCTCG GCCGTCTTCT GCTTCGCGCC GGCGGCTTCC AGAACGACCC CAAGTATGTC 
GAGCGCGAAT ATGTCGAGTA CATCGAATCC GCCGACCCGC GTCGTCTCCC GGGCGAAGTC 
CTGAAGGTCG CGGACAAGGG TGTGAAGGCC GGCGTCCTCA AGGCGAACGA TCCGTTCGTG 
CTTGACGCGA TGACGCAGGC CAAGGGCCGT ATCGCTGCCG ACAAGGCCTC GCTGCCTGCA 
CTCGACCGCG AAGCTCGTGC CGGCAAGGAC GGCAAGAGCG CGCTCGCCAT GGCAGACGCC 
TACCTCTCGT ACGACGAAGC GCCCAAGGCC GAGGAAATGT ACAAGATGGC GCTGACCAAG 
GGCGGTATCG ACAAGGACCG CGCCCTGACC CGTCTGGGCA TTGCCCAGAT CGACCAGAGC 
AAGTTCGAGG ACGCCAAGGC CACCTTCGCG CAGGTTGGTG GCACGCGCGC TCCGCTCGCC 
CGCCTGTGGC TGGCTTTCGC GAACACGCAG GCCCGCCCGT AA

Protein sequence

MRVTFGRMTG GLIGKTAMAL VLAAGGLAVG ATGAVAKEKE QKVAKATNSP EFGKAAQTLQ 
KPIADVTASK DKAAAQALIP QLAAIEASVK TPLDRIIYGQ WQQQIGAAAG DSTLQQKGLQ 
NMVDSGQLGD KATLVAYYLG MTAYQNKDYA TASKVLGPLV AANYNDDTAA EVLADSFAQQ 
GQAPQALEAL KGAVAARKAA NGTVPEGWFK RANLIAYKNK LAPQAIEWST MMVENDPTPL 
NWLGAGQLVR EFGQFTSQES LDLGRLLLRA GGFQNDPKYV EREYVEYIES ADPRRLPGEV 
LKVADKGVKA GVLKANDPFV LDAMTQAKGR IAADKASLPA LDREARAGKD GKSALAMADA 
YLSYDEAPKA EEMYKMALTK GGIDKDRALT RLGIAQIDQS KFEDAKATFA QVGGTRAPLA 
RLWLAFANTQ ARP