Gene Saro_1054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1054
Symbol
ID	3916349
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1095516
End bp	1097246
Gene Length	1731 bp
Protein Length	576 aa
Translation table	11
GC content	65%
IMG OID	640443788
Product	amidohydrolase-like
Protein accession	YP_496333
Protein GI	87199076
COG category	[R] General function prediction only
COG ID	[COG1574] Predicted metal-dependent hydrolase with the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.655132
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCGA TGCTAAAGGC AGCTTCCGCG CTTGCCGGTC TTGGCTTGAC GCTTGGTGCA 
GCGGTGCAGG GACACGCTGC GGAAAGCCGG GATTTCGTCA TCACGAACGC GGATGTGCTG 
ACGCCGTCCG GTTCCGCCGA GGCTCTGGCA GTCCACGACG GTGTGATCGT GGCTGTCGGT 
ACGACCGCGG ATGCCGAGGC AAAACTGCCC GGCGCGCGGC GGATCGACCT GAAGGGTGCG 
GCGGTGATGC CGGGGCTGGT CGACAGCCAC GTCCACGTGA CCTTCGCCGG GCTCGAACAG 
TTTGCCTGTC GCATCAGGCC CGGTGCCATG GCCAGGGAGA TCGCCGAAAC GGTGAAGGGC 
TGCGTTGCCA AGGCCAAGCC GGGCGAATGG ATCAACGGCG GCAACTGGGT GGCGGCGGGT 
TTCCGCAAGG GCGAGCAGAA CAAGGCCTTC CTCGATCGCC TCGCCCCGGC AAACCCGGTC 
GTTCTGGTGG ACGAATCGCA CCACAGCCTC TGGGTCAATT CCGCGGCCCT GAGGGCTGCC 
GGGATCACCC GCCAGACCCC TGATCCGGCA GGGGGCGTGA TCGACCGTGA CGGCAAGGGC 
GAACCGACGG GCCTCCTGCG CGAAACGGCG GCGGGGCTCG TTTATTCAGT GGTCCCCGCG 
CCCAGCGAGG AGATGCGGCG CGCCGCGCTC AAGCTCTCGA CCGGGCAGAT GCTATCCTAT 
GGCATCACCG CATTTGCCGA TGCCGGGGTG ACGATGGCGG ATGTCGGAAC GCTGTCGGCG 
CTTTCGGCCG AAGGCGTGCT CAAGCAGCGG GTGCGCGGCT GCATGCGCTG GACGCCGCTG 
CTGGGAGACA CGCCCGAAGC CAACGGCATG GCGCTGATCA ATGCGCGCGC CGCCTATTCC 
ACGCCGCGCT TCCGGCTGGA TTGCGTCAAG GTCGTGCTCG ATGGCGTCCC CACCGAGAGC 
CGCACCGCCT ATATGCTCGA TCCCTATCTG GCGCATGGCC ATGATGACGT GCCGACGCGG 
GGGCTGCCGA TGATCACGCC CGACCGGCTG AACCCGGCCA TCGCCGCGTT CGACAGGATG 
GGCCTTACGG TGAAGTTCCA TGCGGTTGGC GATGCCGCCG TGCGCGAGGC CATCGATTCG 
GTTGCCAATG CCCGCAAGGT CAATGGCTGG GGCGGACCAT CGCACGACGT CGGCCATAAC 
AGTTTCGTCT CCCCCGAGGA TATCACCCGC GTGCGCGATC TGCAGATGAC ATGGGAATTC 
TCGCCCTACA TCTGGTATCC CACGCCGATC GCTTCCAAAG ATATCCGTGG CGTGATCGGC 
GACGAGCGGA TGAAGCGGTG GATTCCCATT CGCGATGCGC TCGAAACCGG CGCGCTGGTC 
GTTGCCGGAT CTGACTGGTC GGTCGTTCCG TCGGTCAATC CGTGGATCGC CATCGAAACG 
ATGGTCACCC GCCAGATCCC GGGAGGCAGC GCGGAGACAT TGGGCGAAGG GCAGAAGATC 
ACTCTTGCCC AGGCTCTGCG CATCTTCACC GAGAACGGCG CCAGCTTCCT TGGTCAGCGC 
GACCAGTTCG GCAGCATCGA GACCGGCATG AAGGCCGATT TCATCGTCGT GGAGCGCAGT 
CCCTACAAGG TCCCTGTGAA CGAAATCCAC AAGACCAAGG TGTTGCAGAC GTTCATTGAC 
GGCGAGCAAG TCTACCTGTC TTCCGAAGCA ACAGGTCAGG GCGCTCCATG A

Protein sequence

MKAMLKAASA LAGLGLTLGA AVQGHAAESR DFVITNADVL TPSGSAEALA VHDGVIVAVG 
TTADAEAKLP GARRIDLKGA AVMPGLVDSH VHVTFAGLEQ FACRIRPGAM AREIAETVKG 
CVAKAKPGEW INGGNWVAAG FRKGEQNKAF LDRLAPANPV VLVDESHHSL WVNSAALRAA 
GITRQTPDPA GGVIDRDGKG EPTGLLRETA AGLVYSVVPA PSEEMRRAAL KLSTGQMLSY 
GITAFADAGV TMADVGTLSA LSAEGVLKQR VRGCMRWTPL LGDTPEANGM ALINARAAYS 
TPRFRLDCVK VVLDGVPTES RTAYMLDPYL AHGHDDVPTR GLPMITPDRL NPAIAAFDRM 
GLTVKFHAVG DAAVREAIDS VANARKVNGW GGPSHDVGHN SFVSPEDITR VRDLQMTWEF 
SPYIWYPTPI ASKDIRGVIG DERMKRWIPI RDALETGALV VAGSDWSVVP SVNPWIAIET 
MVTRQIPGGS AETLGEGQKI TLAQALRIFT ENGASFLGQR DQFGSIETGM KADFIVVERS 
PYKVPVNEIH KTKVLQTFID GEQVYLSSEA TGQGAP