Gene Sare_3896 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3896
Symbol
ID	5705834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4437687
End bp	4438697
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	71%
IMG OID	641273321
Product	amidohydrolase 2
Protein accession	YP_001538678
Protein GI	159039425
COG category	[R] General function prediction only
COG ID	[COG2159] Predicted metal-dependent hydrolase of the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.271019
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTACAC CGGTCGTCGA CGTGCACTCG CACGCCGTAC CGAAGGGCTG GCCCGACCTC 
GGTGCGGCCT GCGGTGGATC CGGCTGGCCC TGGCTGCGGG TCGACTCCGA GCGAGCCGCG 
ATGATCATGC TCGGGGAGAC CGAGTTCCGG CCGGTCGGTG TGGAGTGCTG GGATCCGGCC 
ACCCGACTGG CGGACATGTC CACCGACGGT GTCGACGTGC AGGTGGTCTC GCCGACACCG 
GTCTTCTTCT GCTACGACCG CCCCGCCGTC CAGGCGGTCA AGGTGGCCCG CATCTTCAAC 
GACCGTATGT TGGAGATCAC GGCAGCCGCA GACGGCCGTT TGGTTCCGTT CTGCCAGGTG 
CCGTTGCAGG ACCCGGAGGC CGCCTGCGCC GAGCTGGACC GCTGCCTCGC CGCGGGGCAC 
GCCGGGGTGG AGATCGGAAA CCATGTCGGC GACCTCGACC TGGACGACAC CGGCATCGTC 
GAGTTCCTCA CCCACTGCGC CGAGGTGGGC GCGCCGGTCT TCGTCCACCC GTGGGACATG 
CCAGGCGGGC CGCGGCTGGA CCGGTGGATG GCCCGATGGC TCGCCGGGAT GCCGGCCGAG 
ACCCACCTGT CGGTGCTGGC GATGATCCTC GGTGGCGTCT TCGACCGGGT GCCGGAGACG 
TTGCGGATCT GCTTCGCACA CGGCGGCGGC AGCTTCCCGT TCTGGCTGGG CCGCGCGGAC 
AACGCCTGGC ATCGCCGGGG AGACCTCGTC CGCGGCGCCT CGGAAGGGCC CCCCGGCTCG 
TACCTGGACC GGTTCTTCGT CGATTCGGTG GTGTTCGATC CGGCGGCGCT GCGGCTCCTG 
GTCGACACGA TGGGCGCCGA CCAGGTGCTG GTCGGCAGTG ACTATCCGTA CCCACTCGGG 
GAGCGGCCGG TTGGTGCGGT CGTGCACCGG TCCGACTTCC TCACCGCCGA CCAGCGCATC 
AGCCTGCTCG GCGGCAACGC GTTGCGGTTC CTCGGCCGGG CGCCGGGATG A

Protein sequence

MGTPVVDVHS HAVPKGWPDL GAACGGSGWP WLRVDSERAA MIMLGETEFR PVGVECWDPA 
TRLADMSTDG VDVQVVSPTP VFFCYDRPAV QAVKVARIFN DRMLEITAAA DGRLVPFCQV 
PLQDPEAACA ELDRCLAAGH AGVEIGNHVG DLDLDDTGIV EFLTHCAEVG APVFVHPWDM 
PGGPRLDRWM ARWLAGMPAE THLSVLAMIL GGVFDRVPET LRICFAHGGG SFPFWLGRAD 
NAWHRRGDLV RGASEGPPGS YLDRFFVDSV VFDPAALRLL VDTMGADQVL VGSDYPYPLG 
ERPVGAVVHR SDFLTADQRI SLLGGNALRF LGRAPG