Gene Saro_3775 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3775
Symbol
ID	5077923
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	414152
End bp	415393
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	69%
IMG OID	640481498
Product	MOFRL domain-containing protein
Protein accession	YP_001166160
Protein GI	146276000
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2379] Putative glycerate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.801472
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAACG ACGAGCAGGC ACGCGGCATT GTGGAGAACG TATTCCGGGC GGCGCTCGAC 
GCGGCCATGG CAGGGCCCGC CGTGCTGCGC CATCTGCCGG AAAAACCGCA AGGACGGTGC 
ATCGTCGTGG GGGCGGGGAA GGCGAGTGCC GCCATGGCCG CGGCAGTTGA CGCCGCCTGG 
CCCGACGTGG CGCTCACCGG CGTGATCGCG ACGCGGTACG GCCACGCAGT GGAAGCAGGG 
AGGATTGCGG TCTTCGAGGC GGGTCATCCC GTGCCGGATG AAAACTCCGT TCGCGCGGCC 
CGGAGAATGC TGGAAGCGGT ACGCGGGCTA GGCCCCGACG ATCTCGTGCT TGCACTTGTA 
TCGGGTGGCG GATCAGCCTC GCTCGCGCTT CCGATGGACG GAATGGATCT TGCCGGGAAG 
CAGGCGGTGA CGCGCGCGTT GCTCAACAGT GGCGCTCCGA TCGGCGAGAT CAACACCGTT 
CGGCGCCATC TCTCCGGCAT CAAGGGCGGG CGGCTGGCAG CGGCTGCCCG TCCTGCCCGG 
GTCGTGACGC TGCTCATAAG CGACGTGCCA GGCGACGATC CCGCAGCAAT CGCCTCCGGC 
CCGACGCTGG CCGACAGTTC CACCCCTGCG GATGCCGTCG CCATACTGGA ACGCCACGGC 
ATTCCGGTAC CCCAGGCACT GCGCAACGCG AGGCCTGCCC CTTCCCCTGC CGACAATGGC 
GAATGCCACC TTGTCGCGAC ACCGTCGCGC GCGCTCGACG CAGCAGCAGC GCGAGGGCGG 
GCACTTGGCT GCGATGTGGT GAACCTGGGC GATGCGCTGG AGGGAGAAGC GGCGGACCTG 
GGCCGCGAAC TCGCGCGTGA CGCGCTTGAG CGCGGGCGTA GCGCTGCCGG GCCGCTATTG 
CTGTTGTCGG GCGGTGAGAC GACCGTCACG ATCGGCCCTG AAGGCGCCGG CGAAGGCGGA 
CGCAACTGCG AGTTCCTGCT CTCGCTCGCT GTTGCGTTCG ACGGGGCCTC CGGTGTCTTC 
GCCCTTGCGG CAGACACGGA CGGGATCGAC GGGACCAGCG ATGCCGCCGG CGCCTTCGTC 
ACCCCATCCA CGCTCGCTCG CGCGCAGGCG CTCGGCCTCG ACCCGGTTGC CGCGCTGGCC 
CGCCACGACA GCTACACGCT CTTTGCCGCA CTGGGCGATC TCGTCGTCAC CGGCCCCACC 
CATACCAACG TCAACGACTT TCGCGCCGTT CTGGTTGGCT GA

Protein sequence

MMNDEQARGI VENVFRAALD AAMAGPAVLR HLPEKPQGRC IVVGAGKASA AMAAAVDAAW 
PDVALTGVIA TRYGHAVEAG RIAVFEAGHP VPDENSVRAA RRMLEAVRGL GPDDLVLALV 
SGGGSASLAL PMDGMDLAGK QAVTRALLNS GAPIGEINTV RRHLSGIKGG RLAAAARPAR 
VVTLLISDVP GDDPAAIASG PTLADSSTPA DAVAILERHG IPVPQALRNA RPAPSPADNG 
ECHLVATPSR ALDAAAARGR ALGCDVVNLG DALEGEAADL GRELARDALE RGRSAAGPLL 
LLSGGETTVT IGPEGAGEGG RNCEFLLSLA VAFDGASGVF ALAADTDGID GTSDAAGAFV 
TPSTLARAQA LGLDPVAALA RHDSYTLFAA LGDLVVTGPT HTNVNDFRAV LVG