Gene Saro_2394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2394
Symbol
ID	3916713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2560701
End bp	2562269
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	67%
IMG OID	640445149
Product	deoxyribodipyrimidine photolyase-related protein
Protein accession	YP_497664
Protein GI	87200407
COG category	[R] General function prediction only
COG ID	[COG3046] Uncharacterized protein related to deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGCCC CCGCTCCCTC CACCCCCGTC ATCGTCCCCA TCCTCGGCGA CCAGCTTTCA 
CCCCACATCT CGAGCCTTGC CGACCGCAGC CCCGACGACA CCGTGATCCT GATGATGGAA 
GTGACGGAGG AGACGACCTA CGTCCGCCAC CACAAGGCCA AGATCGCTAT GATCCTCTCG 
GCCATGCGCC ACTTCGCCGA GGAACTGCGC GGGGCCGGGT GGACGGTCGA TTACGTACGG 
CTCGACGATC CCGCCAACAC CGGCACCTTC ACTGGCGAGG TAGCCCGCGC GGTGGAGCGC 
CACGGCGCGC GCGGGGTGCA GGCCACCGAG CCCGGCGAAT GGCGCGTCAG GCAGGCGATG 
GAGCACTGGC GCACCGACCT TCCCGTCCGC GTGCGCATAC TCCCCGACAC CCGTTTCGTC 
TGCCCCCTCC CCGACTTCTA CGAATGGGCC GCCGGTCGCA AGGAACTGCG CATGGAGTGG 
TTCTACCGCG AGATGCGGCG GAAGACCGGC CTGCTGATGG ACGGCGACAA GCCCGCCGGC 
GGCCGCTGGA ACTTCGACGC CGAGAATCGC GGCGGACCGG AAGCCGGCCT CAAGCCTCCC 
GCCCCGCCCC GCTTCACGCC TGACAGCATC ACCGGTGAAG TCCTCGATCT CGTCTCGACG 
CGCTTTGCCA GACATTTCGG GTCGCTCGAA AACTTCGGCT GGCCCGTCAC CCGCACCGAG 
GCCGAAGCCG CGCGCGATGC GTTCCTCGCC GACCGTCTTC CCCGCTTCGG CAAATATCAG 
GACGCGATGG TCGCGGGCCA GGACTTCCTG TTCCACGCAG TCCTCTCGCC TGCCATCAAC 
ATCGGCCTGT TAGACCCGCT CGACCTCTGC CGCCGCGCAG AGACCGAATG GCGCGAGGGC 
CGCGCGCCGC TCGAGGCGGT GGAAGGCTTC ACCCGCCAGA TCATCGGCTG GCGCGAATAC 
GTGCGCGGCA TGTACTGGCT CGAGATGCCA GCACTCGCGG ATGCCAACGG CCTGGACGCG 
CACCGACCCC TGCCCGACTT CTACTGGACC GGCGATACGC CGATGCGCTG CCTCGCCGAT 
TGCGTGCGGA CCACGCGCGA CAATGCCTAT GCCCACCACA TCCAGCGCCT GATGGTGCTG 
GGCAACTTCG CGCTACTGGC AGGCCTCAGG CCGCAGGACG TCGCGGACTG GTATCTCGTC 
GTCTATGCCG ACGCCTTCGA ATGGGTCGAA CTGCCCAACG TCGCGGGGAT GGTGCTCCAT 
GCCGACAAGG GCCGCCTCGC CTCCAAGCCC TACGCCGCGA GCGGGGCCTA CATCGACAGG 
ATGGGCGACT ACTGCGGCAA ATGCGCGTTC GATGTGAAGC GGAAGACCGG CGAAGGCGCC 
TGCCCGTTCA ACGCGCTCTA CTGGCACTTC CTCGCCCGCA ACGAGAAGAA GCTTGCAGGC 
TACCACCGCC TCGCCCAACC TTACGCCACC TGGCGGCGAA TGAGCGACGA AAAGCGCGCG 
GAATATCTCC TCAGCGCCGA GGCCTTCCTC CGGACGCTCG ATCCCGCAAA GCCCGGATGG 
GCGCGCTAG

Protein sequence

MSAPAPSTPV IVPILGDQLS PHISSLADRS PDDTVILMME VTEETTYVRH HKAKIAMILS 
AMRHFAEELR GAGWTVDYVR LDDPANTGTF TGEVARAVER HGARGVQATE PGEWRVRQAM 
EHWRTDLPVR VRILPDTRFV CPLPDFYEWA AGRKELRMEW FYREMRRKTG LLMDGDKPAG 
GRWNFDAENR GGPEAGLKPP APPRFTPDSI TGEVLDLVST RFARHFGSLE NFGWPVTRTE 
AEAARDAFLA DRLPRFGKYQ DAMVAGQDFL FHAVLSPAIN IGLLDPLDLC RRAETEWREG 
RAPLEAVEGF TRQIIGWREY VRGMYWLEMP ALADANGLDA HRPLPDFYWT GDTPMRCLAD 
CVRTTRDNAY AHHIQRLMVL GNFALLAGLR PQDVADWYLV VYADAFEWVE LPNVAGMVLH 
ADKGRLASKP YAASGAYIDR MGDYCGKCAF DVKRKTGEGA CPFNALYWHF LARNEKKLAG 
YHRLAQPYAT WRRMSDEKRA EYLLSAEAFL RTLDPAKPGW AR