Gene Saro_1229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1229
Symbol
ID	3917860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1281400
End bp	1282374
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	69%
IMG OID	640443966
Product	putative deoxyribodipyrimidine photolyase
Protein accession	YP_496508
Protein GI	87199251
COG category	[R] General function prediction only
COG ID	[COG3380] Predicted NAD/FAD-dependent oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0596771
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGATGC ATGTTGCAAT CGTTGGCGCG GGCATGGCCG GTCTTTCCTG CGCAAGCCAT 
CTCGTGCGTG CAGGTCACAG GGTCTCGCTC TTCGACAAGG GGCGCGGACC GGGCGGGCGC 
ATGTCGACGC GCCGCATGGA AACGCCGCTG GGCGATGCCC ATTTCGACCA TGGCGCGCAG 
TACTTCACAG TCCGCGACCC GGCATTCATG GCGCAAGTCG CGCGCTGGTC GGCAAGCGGC 
GTGGCCGCGC CATGGCCGGC GGCGGGGACC GGCGCCTGGG TCGGTGTTCC GGGAATGAAC 
GCGGTGATCC GCGAAATGGC GGAGCGACAC GATGTCACAT TCGGCTGGCA CGTGCGCGGG 
CTGGTCAACA GGAACGGAGG CTGGCTCCTG ACCGGCGACG CATCCGGCGG ACAGCGAGTG 
CAGGACGGAC CATTCGACGC GGTCGTGGTC TCGATCCCGC CCGAGCAGGC CGCGGCGATC 
GTCGCGCTGC ACGACCTGTC GCTGGCATCG ACGGCACTGG CGGCACGGTC GCAGCCGTGC 
TGGACGGGCA TGTACGCCTT TGCCGAACGC TTGCCGACGC GGCGCGATGC GGTGCGGGAA 
GCAGGCCTCG TCAGTTGGGC GGCCCGCAAT GGCGCCAAGC CGGGGCGCAC CGGACCGGAA 
ACCTGGGTCG TGCAGGCAAC GCCGCAGTGG TCGGCCGACC ATATCGAAGA TTGCGCCGAC 
GCGGTGGCTG GCACGCTCCT CTCATCGCTG GGCGAAGCGC TGGGGGTGGA CATTGCTGTC 
CCGGTGGTGG CTTCGGCGCA CCGCTGGCGT TATGCCATGT CGACAGGAAG CGACCTCGGG 
GCACTGTGGA GCGCGACGTC ACGGATCGGC ATCTGTGGCG ACTGGCTGCT TGGACCGCGC 
GTCGAGAACG CATGGCTTTC GGGACGTACG CTGGCCGAGC GAATGCTGGC GAGTGTGCCG 
CAGGCAGCAG CCTGA

Protein sequence

MQMHVAIVGA GMAGLSCASH LVRAGHRVSL FDKGRGPGGR MSTRRMETPL GDAHFDHGAQ 
YFTVRDPAFM AQVARWSASG VAAPWPAAGT GAWVGVPGMN AVIREMAERH DVTFGWHVRG 
LVNRNGGWLL TGDASGGQRV QDGPFDAVVV SIPPEQAAAI VALHDLSLAS TALAARSQPC 
WTGMYAFAER LPTRRDAVRE AGLVSWAARN GAKPGRTGPE TWVVQATPQW SADHIEDCAD 
AVAGTLLSSL GEALGVDIAV PVVASAHRWR YAMSTGSDLG ALWSATSRIG ICGDWLLGPR 
VENAWLSGRT LAERMLASVP QAAA