Gene Smed_3972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3972
Symbol
ID	5319070
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	422990
End bp	424867
Gene Length	1878 bp
Protein Length	625 aa
Translation table	11
GC content	62%
IMG OID	640775781
Product	amidohydrolase 3
Protein accession	YP_001312714
Protein GI	150376118
COG category	[R] General function prediction only
COG ID	[COG1574] Predicted metal-dependent hydrolase with the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCG ATCTGATCCT GCACCGTGGT CTGGTGACCA CGCTGGACGC CGCGAAACCG 
AACGCCACGG CCATCGCCGT CAAGGACGGC AGGTTCCTTG CCGTCGGGCT GGACCAAGAG 
GTCATGGCGC TTGCCGGGCC GGACACGAAG GTCGTCGACC TGAAGGGCAA GCGCGTCCTG 
CCTGGCCTCA ATGACAACCA TACCCACGTT GTGCGCGGTG GGCTTAATTT CAATATGGAA 
CTGCGCTGGG ACGGCGTGCG CTCTCTCGCC GACGCCATGA ACATGCTGAA GCGGCAAGTG 
GCGATCACGC CGCCTCCGCA ATGGGTGCGC GTCGTCGGCG GCTTCACCGA ACATCAGTTC 
ATTGAAAAGC GGCTTCCGAC GATCGACGAG ATCAACGCGA TCGCCCCCGA CACGCCGGTG 
TTCCTCCTGC ACCTTTATGA CCGGGCACTG CTCAACGGCG CGGCATTGCG CGCGGTTGGT 
TACGGCAAGG ACACGCCGGA TCCGCCCGGA GGTGAGATCA CCCGGGACGC CAGGGGCAAT 
CCGACCGGGC TGCTCATCGC CAAGCCGAAT GCGGGCATTC TCTATTCGAC GCTTGCCAAG 
GGACCGAAGC TTCCATTGGA ATATCAGGTC AATTCGACTC GGCACTTCAT GCGCGAGCTC 
AATCGGCTCG GGATCACCAG CGTCATCGAC GCGGGCGGCG GCTTCCAGAA CTATCCAGAC 
GACTACGCCG TCATTCAGAA GCTCGCCGAC GAAGGGCAGA TGACGGTGAG ACTTGCCTAC 
AACCTCTTCA CCCAGAAGCC GAAGGAGGAG AAGGAAGACT TTCTCAAGTG GACGTCCTCC 
GTAAAATACA AGCAGGGCGA TGACTTCTTC CGTCACAACG GCGCTGGCGA AATGCTCGTC 
TTCTCTGCGG CAGACTTCGA GGATTTCCGC GAACCGCGCC CGGAAATGGC GCCCGAAATG 
GAAGGTGAGC TTGAGGAAGT CGTGCGAATT CTAGCGGAGA ACCGCTGGCC CTGGCGCCTG 
CACGCGACAT ACGACGAGAC GATCAGCCGT GCGCTCGACG TCTTCGAGAA AGTCAACCAG 
GACATCCCGC TTGCCGGCAT CAACTGGTTC TTCGACCATG CCGAGACGAT CTCGGACAGC 
TCAATCGACC GCATCGCGGC GCTGGGCGGC GGCATAGCGG TACAGCATCG CATGGCCTAT 
CAGGGCGAGT ATTTCGTCGA ACGCTATGGC CATGGTGCCG CCGAAGCTAC GCCGCCGGTC 
GCGCGCATGC TGGATAAAGG CGTCAAGGTC TCCGCGGGCA CGGACGCCAC GCGCGTCGCC 
TCCTACAATC CCTGGGTTTC GCTTTCCTGG CTGGTGACCG GTAAGACGGT CGGCGGTATG 
CAGCTCTATC CGCGCGCCAA CTGCCTCGAC CGCGAAACGG CGCTGCGGAT GTGGACCGAG 
AAAGTCCAAT GGTTTTCCAA CGAGGAGGGC CGGAAGGGCC GCATCGAAAA GGGGCAGCTC 
GCCGACCTTA TCGTGCCGGC CAAAGACTAT TTCACCTGTG CCGAGGACGA GATCTCGTTT 
CTGACTGCCG ATCTGACGAT GGTCGGGGGC AGGATCGTCT ATGCGGCAAA CGATTTCGCC 
AGCCTCGACG AGAACCCTCT GCCGCCGGCG ATGCCCGACT GGTCGCCGGT AAGGAACTAT 
GGCGGCTATG CGGCGTGGGG CGAACCGGAG GGCGCGGGAA GGCATTCGCT GAAGCGAACG 
GCAATCGCGT CCTGCGGCTG CGCCAGCAAT TGCGGGGTCC ATGGGCACGA CCATGCCGGC 
GCCTGGACAT CGAGACTGCC GGTTGCAGAC CTGAAAGGGT TCTTCGGCGC GCTTGGCTGC 
TCTTGCTGGG CCGTGTGA

Protein sequence

MSADLILHRG LVTTLDAAKP NATAIAVKDG RFLAVGLDQE VMALAGPDTK VVDLKGKRVL 
PGLNDNHTHV VRGGLNFNME LRWDGVRSLA DAMNMLKRQV AITPPPQWVR VVGGFTEHQF 
IEKRLPTIDE INAIAPDTPV FLLHLYDRAL LNGAALRAVG YGKDTPDPPG GEITRDARGN 
PTGLLIAKPN AGILYSTLAK GPKLPLEYQV NSTRHFMREL NRLGITSVID AGGGFQNYPD 
DYAVIQKLAD EGQMTVRLAY NLFTQKPKEE KEDFLKWTSS VKYKQGDDFF RHNGAGEMLV 
FSAADFEDFR EPRPEMAPEM EGELEEVVRI LAENRWPWRL HATYDETISR ALDVFEKVNQ 
DIPLAGINWF FDHAETISDS SIDRIAALGG GIAVQHRMAY QGEYFVERYG HGAAEATPPV 
ARMLDKGVKV SAGTDATRVA SYNPWVSLSW LVTGKTVGGM QLYPRANCLD RETALRMWTE 
KVQWFSNEEG RKGRIEKGQL ADLIVPAKDY FTCAEDEISF LTADLTMVGG RIVYAANDFA 
SLDENPLPPA MPDWSPVRNY GGYAAWGEPE GAGRHSLKRT AIASCGCASN CGVHGHDHAG 
AWTSRLPVAD LKGFFGALGC SCWAV