Gene Sare_2139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2139
Symbol
ID	5707265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2462631
End bp	2463857
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	70%
IMG OID	641271624
Product	amidohydrolase
Protein accession	YP_001536995
Protein GI	159037742
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.018924
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGAAT GTATCGAGGC GGACCAGTTG ATTCCTGGAC GTGGTGAACC GGTGGCGAAC 
GCCGTCGTCG TCCTTGAGGA CGCGACGATC CGGTATGCCG GGCCGGCGGA GCATGCCCCC 
AAGGTGGCCG AGGCGCGGCG CAGCCGGGCA CATACCGTAC TGCCCGGCCT GTGGGACAGC 
CACGTGCACT TCATGGGGCT GCGTTCGGCT GACGTCGGGA TCTTGCCGCA GGAGCCGGTG 
GCGCTGCGAG CCGCGCGGAC GGTCGCCGAC CTGCGTGCCG CACTGGACGC CGGGTTCACC 
TCGGTACGCG AGGTGGGCGG GCTGGGCCTC GACCTGGCCC GTGCCGTCGA GGAAGGTACC 
GCCGTCGGCC CGTCGGTCTA TGCCGCCGGA TGTGCCCTGT CCACCACGGG TGGTCACGGC 
GACCTGCACA GCTACCCGTT GGCCTGGATG GAGGAGTTCG CCCGGCACGG AGGTGAGCTG 
CGACTGGCTG ACGGCGAAGC CGAGTGCGTC CGGGCGGTGC GGGAACAGCT ACGACGTAAT 
GCCAAGGTGA TCAAGGTTTA TGCCTCCGGT GGCGTGCTCT CCGAGGTCGA CCACCCCATC 
CACAGGCAGT TCACCGATCG GGAACTGCGC GCGATCGTCG AGGTCGCCGG CCTGGCGGAC 
CGGGTCGTCG CGGCGCACTG CCACGGCAAG CCCGGCATGA TGGCCGCGAT CGAAGCCGGC 
GTACGCACCA TCGAGCACGG CACCTACCTG GACGAGGAGG TGGCGGCGGC GATGCGGGAG 
ACGGGGGCGA TCCTCGTCAC CACCCGCACG ATCATGCAGG AGCTGATCGA CAGCCGGGCC 
CTCCCGCCGT ACGCCCTGCG GAAGCTGGAG TCGATTGTCG ACCGCCATGC CGAGGCGATC 
GTGATCGCAC GAGAGAGCGG GGTACGGATC GCCGCCGGTA CGGATGTCGC CCTCACCGGT 
GCCGAGCTGC CCGACTCGTG GGGCCGCAAC GGGCGTGAGT TGCCGCTACT GGCAGAGATC 
GGGTTCTCGC CGCTGGAGGT GATCGAGGCG GCGACCGCCG CGGCTCCCGC CACCCTCGGA 
CCCCAGGCGC CCCGTTCGGG TCAACTCGTC GAGGGGTACG ACGCCGACGT GATCACCCTG 
GACGCGGACC CCCTCGCCGA CATCGGCGTG CTGGCCAAGC CGGCACACAT CACCGGTGTC 
TGGAAGGCCG GATGCCGCGT CGCGTGA

Protein sequence

MIECIEADQL IPGRGEPVAN AVVVLEDATI RYAGPAEHAP KVAEARRSRA HTVLPGLWDS 
HVHFMGLRSA DVGILPQEPV ALRAARTVAD LRAALDAGFT SVREVGGLGL DLARAVEEGT 
AVGPSVYAAG CALSTTGGHG DLHSYPLAWM EEFARHGGEL RLADGEAECV RAVREQLRRN 
AKVIKVYASG GVLSEVDHPI HRQFTDRELR AIVEVAGLAD RVVAAHCHGK PGMMAAIEAG 
VRTIEHGTYL DEEVAAAMRE TGAILVTTRT IMQELIDSRA LPPYALRKLE SIVDRHAEAI 
VIARESGVRI AAGTDVALTG AELPDSWGRN GRELPLLAEI GFSPLEVIEA ATAAAPATLG 
PQAPRSGQLV EGYDADVITL DADPLADIGV LAKPAHITGV WKAGCRVA