Gene Saro_2656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2656
Symbol
ID	3918430
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2893230
End bp	2894366
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	67%
IMG OID	640445433
Product	DNA polymerase IV
Protein accession	YP_497926
Protein GI	87200669
COG category	[L] Replication, recombination and repair
COG ID	[COG0389] Nucleotidyltransferase/DNA polymerase involved in DNA repair
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACCCTC GATCGGCAGA TGGCGAACCG GATCGCAGCG CGACCGGGCT GCGCAAGGTC 
ATCCATGTCG ACATGGACGC CTTCTTCGCC AGCGTCGAGC AACGCGACAA TCCGGACCTG 
CGCGGAAAGC CGGTCGCGGT CGGCGGTTCC TCCGGGCGCG GGGTCGTTGC CGCGGCAAGT 
TACGAGGCCC GCAAGTTCGG CGTACGATCG GCTATGCCTT CGGCGAGGGC CATCGTGCTG 
TGTCCCGACC TGATCTTCTG CAGGCCGCGA TTCGATGTCT ATCGCTCCGT TTCCCAGCAG 
ATCCGCGCCA TCTTCCTCGA CTACACGCCC CACGTCGAAC CCCTGTCGCT CGACGAGGCC 
TATCTCGACG TGACCGATGA CGTGCGCGGC ATCGGTTCCG CCACGCGGAT CGCCGAACTC 
ATCCGCCGGC GGATCAAGGC CGACACCGGG CTGACCGCCA GTGCCGGTGT GTCCTACAAC 
AAGTTCCTCG CCAAGATCGC GAGCGACCAG AACAAGCCCG ACGGCATGTG CGTGATCCGG 
CCCGGCGAGG GCGCGCAGTT CGTCGCCAGC CTTCCGGTGC GGCGCTTCCA CGGCATCGGA 
CCGCGCGGTG CGGAAAAGAT GGCGGCGCTC GGGATAGAGA CGGGCGCGGA TCTGCGTGCC 
AGGGACCTGC CTTTCCTGCG CCAGCATTTC GGCAGCCTCG CGGACTATCT CTACCGGGCG 
GTGCGGGGCA TCGACCTGCG CCAGGTGAAG GCCGACAGGC CGCGCAAGTC GGTCGGCGCG 
GAGCGGACGT TCGAGCGTGA CATTTCGTCC GGCCCGGCCT TGCGCGAAAC GCTGGAGCGC 
ATCCTGGAGA TCGTGTGGGA TCGGATCGAG CGCAGCGGGG CCAGCGGTCG GACGGTCACC 
CTCAAGATGA AATTCAACGA CTTCACCCCA ATTACCCGTG CCCGCTCCCT GCCGCGCCCG 
ATCGCAGACA AGGAGGAATT TGCCCGGCTG TCGCGTGAAC TGCTCGATGC GCAACTGCCG 
CTTGCCAAGC CGATCAGGCT GATGGGGCTG ACGCTGTCCG CTCTCGAGGG CGAGGAGCCG 
GAAGAGGCCG AGGACGGTCC CTCCGGCGCA GCGCTTCAAG CAGAACTGCC CTTCTGA

Protein sequence

MDPRSADGEP DRSATGLRKV IHVDMDAFFA SVEQRDNPDL RGKPVAVGGS SGRGVVAAAS 
YEARKFGVRS AMPSARAIVL CPDLIFCRPR FDVYRSVSQQ IRAIFLDYTP HVEPLSLDEA 
YLDVTDDVRG IGSATRIAEL IRRRIKADTG LTASAGVSYN KFLAKIASDQ NKPDGMCVIR 
PGEGAQFVAS LPVRRFHGIG PRGAEKMAAL GIETGADLRA RDLPFLRQHF GSLADYLYRA 
VRGIDLRQVK ADRPRKSVGA ERTFERDISS GPALRETLER ILEIVWDRIE RSGASGRTVT 
LKMKFNDFTP ITRARSLPRP IADKEEFARL SRELLDAQLP LAKPIRLMGL TLSALEGEEP 
EEAEDGPSGA ALQAELPF