Gene Saro_2471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2471
Symbol
ID	3916790
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2669717
End bp	2671183
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	62%
IMG OID	640445226
Product	hypothetical protein
Protein accession	YP_497741
Protein GI	87200484
COG category	[S] Function unknown
COG ID	[COG5361] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCCGA AGCGTGCAAA ACGGAGGCGC AGCGCGGTAG CACCACTTGC CTTGTTGCTC 
GCGATGTCGC TTCCGGTCGT CTCTTCAGGA GCGGAAATTG CCCGTGCCTA CGATCCGGGT 
CTGGCGGACC AGTTCCAGTC CGCGCGCATC GACGAAATCC TGCCGCAAGA TCCCGAAGCC 
AGGCAGACAT TCGCGCGGTC ACTGGCTTTC GACGCCACGC TTTACGGCAC GGCAGCGGTT 
CTTGAATATC GCCAGCTCTA TGCGCTTGCC GTGGACCGGA GCGATCCGCA GTACGTCGGC 
TTCAATACTT TTTCCCATGG CCGGACTCTG GCCGGCCCGG GCTACAAGCC ATTCAAGACG 
CCCAACGCCG ACACACTCTA TTCGAACGCC TGGCTGGATT TGCGGAATGG TCCGGTCATG 
TTCGAGGTGC CCGATACCGC AGGCCGGTAC TTCACCGCGA ACTTCCTCGA CGTTCACGGC 
AACGCTTCAA ACATCAGCGC GCGCACGCAC GGCTTCAGTG GAGGCCGGTT CCTGATCGCG 
ACGACAGACT GGCAGGGCGA AGTCCCCGAA GGAACCACGC TGTTCCGCGT CACAACGCCG 
TTCACGTGGA TCCTGCTCAG GGTTCTGGTG CAACAATCTG GCGACGATGT GCGCATGGCG 
TACGCTTTGC AGGACCGCTT CCGCCTCCAT CCAGTGGGTC ACGGAGCCGG CGCGGTAAAC 
TTTCCCGATG GCCGAGACAC AAGCGCGGCG GGTTTCATGC GCATCCTCGA TTTCGTGCTG 
CGCAATTGCG GCCATCCGAA AAGCGAAGAA GCGCTGCTCC ATCGGTTTCG CTCGATCGGC 
ATTGTCGGCA AGCGCACCGT CGACGAGGTT CTGACGGACG CCCGGATGCA AGCCGGAATC 
GAACAGGGCT TCACCGAGGC GCAGGAACTC ATCAGGGTGT CGATGAGCCA GAACGGACCG 
CGTGTCGGCG GCTGGTCCGA GCCGGTCGAT GTCGGGCGCT ACGGTTTCAA TTACCTTTAT 
CGCGCAGTCA TCAACACGCG CGGCACCGGC GCGAACGTCG TCGAGGAGAA CCACCCCTTT 
TCAACGTTCG TCGATGCCGA TGAAGAGCGC CTCGACGGCT CGCGAGGAGA CTATCGCCTT 
GTTCTGTCTC CTCCACCGCC CGCGCGGTTC TTCTGGTCGG TTACCGTCTA CGATTCTGCA 
ACCCGAGAGC TTGTTCCCAA TCCGCTCGCC CGTTACCTGA TCAGCGACCG GACTCCCGGG 
CTGAAGCGGG GCAAGGATGG ATCGGTTGCG ATTCTGTTCA GCCACAGGCT CAGTGGTCGT 
GCCAAGGGCG CCAACCTTTT GCCCGTTCCT GCCGGTCCCT TCCACGTCGT CATCCGCGCA 
CAGGGACCTG ATGCGGCAAT AACCAACGGC GAATGGCGCC CCCCGGCAAT CCAGAAGATG 
CCGGTTGCCA GAACGGCGGC GAAGTGA

Protein sequence

MNPKRAKRRR SAVAPLALLL AMSLPVVSSG AEIARAYDPG LADQFQSARI DEILPQDPEA 
RQTFARSLAF DATLYGTAAV LEYRQLYALA VDRSDPQYVG FNTFSHGRTL AGPGYKPFKT 
PNADTLYSNA WLDLRNGPVM FEVPDTAGRY FTANFLDVHG NASNISARTH GFSGGRFLIA 
TTDWQGEVPE GTTLFRVTTP FTWILLRVLV QQSGDDVRMA YALQDRFRLH PVGHGAGAVN 
FPDGRDTSAA GFMRILDFVL RNCGHPKSEE ALLHRFRSIG IVGKRTVDEV LTDARMQAGI 
EQGFTEAQEL IRVSMSQNGP RVGGWSEPVD VGRYGFNYLY RAVINTRGTG ANVVEENHPF 
STFVDADEER LDGSRGDYRL VLSPPPPARF FWSVTVYDSA TRELVPNPLA RYLISDRTPG 
LKRGKDGSVA ILFSHRLSGR AKGANLLPVP AGPFHVVIRA QGPDAAITNG EWRPPAIQKM 
PVARTAAK