Gene Saro_0605 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0605
Symbol
ID	3915617
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	649374
End bp	651143
Gene Length	1770 bp
Protein Length	589 aa
Translation table	11
GC content	70%
IMG OID	640443335
Product	allophanate hydrolase
Protein accession	YP_495886
Protein GI	87198629
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0154] Asp-tRNAAsn/Glu-tRNAGln amidotransferase A subunit and related amidases
TIGRFAM ID	[TIGR02713] allophanate hydrolase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGCGG CGCCGCGCCC CACCGCCCGC GCCATTGCCG CAGCGGTCAA CTCCGGGCAG 
ACCACCGCAC TGGCCGTGGC AGAGGCCACC CTGCTCCGGC TCGCCGCCTA CGACGCGGTC 
CAGCCGCAAA TCTGGATCAG CCGCGCCAGT CCCGAAGCCC TGCTGGCAGC CGCTCGCGCC 
ATCGATGTGC GCCTCGCCGC CGGAGAGGAC CTCCCGCTCG CGGGCGTCCC CTTCGCGGTA 
AAGGACAACA TCGACGTCGC CGGCTTCCAC ACCACTGCCG CCTGCCCGGC CTTCGCCTAT 
CGGCCCGCAA CGTCGGCGAC GGTTGTGGAG CGCCTGCTCG CGGCGGGCGC GCTCTGCGTC 
GGCAAGACCA ACCTCGATCA GTTCGCGACC GGCCTCAACG GCACGCGCAG CCCCTATGGC 
GCCCCGCGCA ATGCCCACAA CCTCGCCTAT GTCAGTGGCG GCTCCAGCTC CGGCTCGGCC 
AGCGCGGTGG CGGCCGGGCT CGTCGCCTTC GCCCTCGGCA CGGACACCGC AGGGTCCGGG 
CGCGTACCCG CCGCGTTCCA GCACCTCGTC GGCTTCAAGC CGAGCAAGGG CCGGTGGAGC 
AATCGCGGGC TCGTCCCGGC GTGCCGCACG CTCGACTGCA TAACCGTCTT CGCCCACGAC 
ACCGCCGATG CGCGCATTGT CGACGGCATC GTCGCGGGGT TCGATCCGGC CGACGCCTTC 
TCCAAACCAC TCGCGGACCG ACCACGGAAG ATGCGCGCCA TCGGCGTGCC CCGCCGCGAC 
CAGCGCGCCT TCTTCGGCGA TGTCGAGGCC GAACATCTCT ACGACCGCGC CCTGGACCGG 
CTTTCGACGC TCGGCCGGAT CGTCGAGATC GACTATGCCC CGCTGCAGGA AGCAGCGCAG 
CTTCTCTACG GGGGCCCCTG GGTTGCCGAA CGGACCGCCG CACTGGCCGG CCTCCTTGCC 
GACAATCCCG ACGCCCTGGA CCCGACCGTC CGGGAAGTCG TGGCGCCCGG GCAGGACATC 
GGCGCGGTAG ACCTGTTCAA CGGCATCTAC CGGCTCGCCG AACTGAAACG ACACGCCGAC 
ACGCTCTGGG AAAGCATCGA CCTGCTGGCC TTTCCCACCA CGGGCACGAC CTATCGGGTG 
GCGGAATTGC TGGCCGCACC AATCGCACTC AACAGTGCGC TTGGGTACTA TACCAACTTC 
GTGAACCTGC TCGACATGGC CGCGCTCGCC GTGCCGGCCG GCTCGCGGGC CAACGCGACC 
GGCTTCGGCG TGACCCTGAT CGGGCCGGCC GACACCGACC TGGCGCTTCT CGACGCGGCG 
GAAGCCTATC TGTCCGTGGC AGATCTCCCA CCACCACCTC CGCTCGACCT GGAGGGCAAG 
ATGCAGACCG TGAAACTCGC CGTCGTTGGC GCCCATCTCA AGGACATGCC GCTCCACTGG 
CAACTCACCT CGCGCGACGC GAAATTCGTG GGCGCGTTCG AAACCGCCCC CAACTACCGC 
CTCTACGCCA TGGCCGACAG CGTGCCGCCC AAGCCTGCGC TGATCCATAG CGAGGACGGC 
GGCGCCATCG CTATCGAGGT CTACGAACTG GGGGTCGCCG AATTCGGCAG CTTCGTGGCC 
GAAGTGCCGC CGCCGCTGGC GATCGGCACG GTCACGCTTG CCGATGGCAG CAGCGTCAAG 
GGCTTCGTCG CGGAACCCCG CGCCCTCGTC GGCGCGCGGG ACATCACCCA CCTTGGCGGC 
TGGCGCGCCT TCGTTGCGGC GGGAGCATGA

Protein sequence

MTAAPRPTAR AIAAAVNSGQ TTALAVAEAT LLRLAAYDAV QPQIWISRAS PEALLAAARA 
IDVRLAAGED LPLAGVPFAV KDNIDVAGFH TTAACPAFAY RPATSATVVE RLLAAGALCV 
GKTNLDQFAT GLNGTRSPYG APRNAHNLAY VSGGSSSGSA SAVAAGLVAF ALGTDTAGSG 
RVPAAFQHLV GFKPSKGRWS NRGLVPACRT LDCITVFAHD TADARIVDGI VAGFDPADAF 
SKPLADRPRK MRAIGVPRRD QRAFFGDVEA EHLYDRALDR LSTLGRIVEI DYAPLQEAAQ 
LLYGGPWVAE RTAALAGLLA DNPDALDPTV REVVAPGQDI GAVDLFNGIY RLAELKRHAD 
TLWESIDLLA FPTTGTTYRV AELLAAPIAL NSALGYYTNF VNLLDMAALA VPAGSRANAT 
GFGVTLIGPA DTDLALLDAA EAYLSVADLP PPPPLDLEGK MQTVKLAVVG AHLKDMPLHW 
QLTSRDAKFV GAFETAPNYR LYAMADSVPP KPALIHSEDG GAIAIEVYEL GVAEFGSFVA 
EVPPPLAIGT VTLADGSSVK GFVAEPRALV GARDITHLGG WRAFVAAGA